상세 컨텐츠

본문 제목

240319화_TIL

TIL

by 30303 2024. 3. 19. 20:37

본문

728x90

이력서 및 포트폴리오 준비

 

프로젝트 주제

크롤링 1건/ 대시보드 1건/ 머신러닝 2건

 

크롤링: 크롤링 시스템을 만든 경험

대시보드: 지표에 대한 설명, 올바른 차트의 사용

머신러닝: 얼마나 잘 이해하고 있는가, 모델의 지표, 모델을 사용하여 어떤 문제를 풀려고 했는가

 

+ 공모전, 실제 문제 해결

 

지원하는 분야의 현재 떠오르는 문제와 관련된. 해당 산업에서 현재 관심을 가지고 있는 문제가 무엇인지.

ex. 이커머스 최적화 가격 모델링 -> 비슷한 것? 주식 데이터

∴ 비슷한 유형의 데이터와 모델로 작업 진행

 

데이터를 기반으로 탄탄한 스토리라인 구축.

 

Q. 데이터의 크기가 중요한지.

A. 아니다. 분석의 깊이가 중요. 데이터 분석가란, 새로운 시각으로 데이터를 바라보는 것. 내가 몰랐던 것을 아는 이를 채용하고자 한다. 

대규모 전처리 기술은 주니어 레벨을 이미 벗어났다. 적은 데이터로 보더라도 분석의 깊이가 깊어야 할 것. (ex. 통계, 머신러닝)

 

Q. 프로젝트 진행 방식, 배경/ eda<-> 문제정의/가설설정/ 분석/결과 결론/ 액션플랜/ 한계점 이 정석인지.

A. 그렇다. 변경한다면, 한계점을 빼거나, 결론과 모델링을 앞단에 제시하는 것을 추천. 

 

Q. 심도 깊은 분석이란?

A. 지표를 예를 들자면, 대부분 모델링에서 성과가 이렇게 나와서 좋았다. RMSE가 다음과 같다. 로 끝난다.

여기서 그치는 것이 아니라, 예컨대 해당 데이터는 비선형이 강해서 수식적으로 어떤 지표가 적절하다. 라는 측면을 추가하여 분석.

인사이트의 경우, 단순히 이 데이터가 평균보다 높다 낮다. 가 아닌, 왜 이상치로 정했는지, 혹은 제거하지 않았는지. 

로직에 대한 통계적 고찰이 필요하다 + 나의 생각. 한 차원 더 깊게.

 

 

 

'TIL' 카테고리의 다른 글

240326화_TIL  (0) 2024.03.26
240320수_TIL  (0) 2024.03.20
240318월_TIL  (2) 2024.03.18
240314목_TIL  (0) 2024.03.14
240313수_TIL  (0) 2024.03.13

관련글 더보기