코린이의 공부일기

[Boost Camp] WEEK 4 Day 1. P stage(EDA) 본문

BOOST CAMP_정리

[Boost Camp] WEEK 4 Day 1. P stage(EDA)

SOJUNG 2021. 8. 23. 15:44

2021-08-23

P stage start!

 

* 이전 약 3주 간 진행한 U stage에서 경험한 이론을 바탕으로 실제 데이터와 코드베이스를 통한 이해

* Competition형태의 실습을 통해 점진적인 모델 성능 향상을 경험

* 머신러닝 파이프라인의 한 부분을 경험

 

P_stage 는이 세가지의 목적을 가지고 시행하는 과정이다. 

 

 

이 포스팅을 읽기전 이 생각을 갖고 읽어보자!

 

"주어진 데이터를 이용해 원하는 결과를 만들기 위한 가장 좋은 방법이란 뭘까?"

예를 들어,

- 댓글 데이터를 이용한 악성 댓글 분류

- 폐 CT 사진을 이용한 폐 질병 예측

등 ..

데이터들을 가지고 원하는 결과 값을 도출하고 싶다면, 

Competition을 진행해보며 Task을 이해하고 경험하는 것이 중요하다.

 

 

 

Competition에서 가장 중요한 부분은 -> Overview!

 

Overview(목적, 대상, 의미,산출물 등)는 주최자의 바램을 볼 수 있는 부분이다.

이러한 경험을 통해

어떠한 데이터 분석을 하는데에 있어서 방향성을 도출 할 수 있다.

 

방향성을 가지고있어야 어떠한 오류를 풀어내는데에 있어서 중요하다.

 

이것을 EDA(Exploratory Data Analysis)라고 부른다.

 

 

EDA란 ? (* 정말 중요한 부분)

한마디로 데이터를 이해하려는 노력! 즉, 주최자가 어떤 것을 요구하는지, 내가 어떤 output을 내야하는지 파악하는 것 이다.

어떤 output을 내기가 어려운지 checking해보는 것!

 

 

EDA의 목적 

 

EDA의 진짜 목적은 거창한 코드로 분석결과를 만드는 것이 아니라 이 데이터를 봤을 때,  Overview을 보며 느끼는

나의 추상적인 의문점들 -> 이 의문점들을 검증해보는 시간 =EDA

 

쉽게 말하면 목적은 어떠한 방법이든 데이터를 이해하려는 것이다

 

마스터님 말씀 : 데이터에서 내가 어떠한 궁금점이 있는지 명제로 나열해보고 찾아보는게 정말 큰 도움이 될 것 같다:=)

 

 

 

Image는 컴퓨터가 어떻게 인식해서 모델링하는 걸까?

 

컴퓨터가 어떻게 이미지를 인식하는지를 알아보기!

이미지는 RGB의 픽셀 값으로 표현한다.

 

 

 

Baseline 

 

Competition의 절차는 날마다 각각의 베이스라인에 대한 강의를 주고 내가 고쳐보고 작성하는 식이다.

오늘은 첫날이기에 EDA에 관해서 알아보았고 Competition에서 주어진 이미지데이터에 관해 생각해보는 Mission을 부여받았다.

 

 

제공된 베이스라인을 기준으로 순차적으로 제공해주니 내가 이전에 한번 코드를 작성해보며

비교하는게 정말 큰 성장이 이루어질 것으로 예상된다!!!(★ 중요 ★)

 

 

 

 

Week 3. 1Day 회고록+Special Mission (주관적인 내 생각)

-target이 되는 y 데이터들을 보면 

마스크의 착용여부(유, 무 , 알 수 없음) /  성별 / 나이대별로 나누어 18가지의 class가 나오는 것을 볼 수 있다.

 input data을 이 18가지로 나누어 훈련시키는 것 아닐까?..

라는 생각을 했다..

또 이거말고도 어떤 생각을 할 수 있을까 란 생각을 해봤는데 딱히 떠오르지가 않는다,,

추가적인 나의 궁금증인데 나이대 별로 잘 구분을 할 수 있을까?,, 흠흠....

이것도 사실 의문...!!!

그리고 이 기반으로 한번 input data을 나눠보려고 하는데 지금 그것도 헤매는중이다..ㅠㅠ

이걸 18가지로 나눠서 하나의 새로운 dataset으로 두고 풀면 되는걸까?

이런 생각도 들고,, 한번도 안해본거여서 그런지 어떻게 틀을 잡아야할지 감이 안온다

그래서 구글링하며 남들이 한 여러 Image Classification 코드들을 보고있는데

감이 올듯 ? 말듯 ?... 하면서도ㅋㅋㅋㅋㅋㅋㅋ 오류도 뜨고...

 

그치만 이게 다 배움이고 나의 피와 살이 되는 것이니 화이팅!!!ㅠ_ㅠ ♡

내일은 강의를 보며 EDA의 틀을 어떻게 잡아야하는지 그 부분을 집중적으로 보며 내가 생각하고

작성한거랑 꼭 비교해보며 문제점을 파악하고 내일 작성해야지. . !!!!!: -)

 

 

 

Comments