상세 컨텐츠

본문 제목

머신러닝으로 접근하는 문제들

ML

by 30303 2024. 3. 15. 10:08

본문

728x90

1. 예측 forecast

시간의 흐름에 따라 기록된 데이터(Time-series Data) 이용, 

변수간 인과관계를 분석하여 미래 예측

 

주 활용 영역

-날씨 예측

-주식 예측

-상품 판매량 예측

 

 

대표적 알고리즘

AR(I)MA, DeepAR

 

AR(auto regression):자기자신을 종속변수로 하고, 이전 시점의 시계열을 독립변수로 갖는 모델

MA(moving average):이동 평균

+행사, 할인 등의 특정한 이벤트를 변수로 넣어 학습

 


2. Recommendation (factorization 기반)

가장 비슷한 취향: Collaborative filtering(협업 필터링)

가장 비슷한 컨텐츠를 찾아주는 방법 -Content based filtering

 

현실데이터의 경우 희소성(sparsity)문제

- matrix factorization , factorization machine 방법으로 해소

 


3. Anomaly detection (이상 진단)

 

공정 프로세스 관리, 금융 사기 거래 탐지

normal 데이터를 벗어나는 데이터를 abnormal로 간주

 

단순 outlier detection부터, out-of-distribution,

one class classification(ex.정상/비정상 중 정상 데이터만 가지고 학습 시킴) 등


4. Image processing

딥러닝 출현 이후 발전, 현재 사람 보다 높은 인지 성능

 

main task

1. classification

2. localization

3.object detection

4. instance segmentation

 

실제 활용

제조업 image processing 적용 양품/불량품 자동 판정 모델

차량 카메라 센서에 이미지 이용

object detection으로 사물 식별

object classification을 통해 사람, 장애물, 차 식별

OCR 활용 아날로그(수기)를 디지털로 전환


5. NLP

natural language processing

컴퓨터가 인간의 언어를 처리하는 모든 기술

 

대표적 task

감성분석, 대화생성(챗봇), SST(speech to text) ex) 번역, 은행 챗봇

 

실제 활용

제품 리뷰의 negative 비율을 관리하여 상품 평판 관리

다양한 미디어 매체의 부정적 의견 모니터링, 회사 평판 관리

CS 업무 반복 질문, 복잡도 높지 않은 질문 자동 응대(인건비 감소)

관련글 더보기