본문 바로가기

머신러닝(ML)

머신 러닝( Machine Learning )이란...

난 이렇게 말하고 싶다.

"머신 러닝이란 정답( correct answer )이 아닌 해답( good solution )을 기계가 산출할 수 있도록 학습 시키는 것이다."

그렇다면, 기계를 어떻게( how ) 가르칠 것인가? 다음은 머신 러닝의 3가지 유형이다. 즉, 학습법이라고 생각해도 무방할 것 같다.

머신 러닝 유형

지도 학습(Supervised Learning)

입력 값에 따라 출력값이 정해져 있는(정답이 있는) 데이터를 기반으로 학습을 하고, 앞으로 발생 할 현상을 예측할 수 있도록 지도하는 방법이 지도 학습이다. 예측값을 추정(Regression)하거나, 속할 부류를 분류(Classification)하는데 주로 사용된다.

알고리즘: 선형회귀(Linear Regression), K-최근접 이웃(k-Nearest Neighbors), 로지스틱회귀(Logistic Regression),서포트 벡터 머신(SVM, Support Vector Machine), 결정 트리(Decision Tree)와 랜덤 포레스트(Random Forest), 나이브베이지(Naive Bayes) 등.

활용 분야

  • 제품의 특성, 가격 등으로 판매량 예측
  • 채무자의 직업, 소득 등으로 상환 가능성 예측
  • 피부 손상의 사진으로 상처가 치료될 때까지 기간 예측
  • 이메일 스팸 여부 판단
  • 건물의 여러 가지 요소를 바탕으로 화재 위험 진단

비지도 학습(Unsupervised Learning)

정답이 없는 데이터를 기반으로 데이터를 군집화(Clustering)하는 학습으로 데이터가 어떻게 구성되어 있는지 찾는데 주로 사용된다. 예를 들어 사진을 보고 비슷한 사진을 파악하고 그룹으로 구분만 지을 수 있다. 구분만 할 수 있지 그 그룹의 정체에 대해서는 알려주지 못한다. 그룹의 정체를 파악하는 것은 사람의 몫이다.

비지도 학습은 답을 알고 싶은 용도가 아닌 입력 데이터의 특성을 파악하는 용도로 사용되며 사람의 의사결정에 도움을 주기 때문에 지도학습과 같이 널리 사용되고 있다.

알고리즘 : K-Means, K-Means++, 계측 군집 분석(HCA, Hierarchical Cluster Analysis), 기대값 최대화 (Expectation Maximization) 등.

활용 분야

  • 소비패턴이 비슷한 고객들끼리 군집화
  • 고객과 시청패턴이 비슷한 다른 고객들이 즐겨보는 영화를 추천 (추천시스템)
  • 게시판 등에서 고객 의견을 비슷한 것끼리 묶어서 정리

지도학습 VS. 비지도학습


강화 학습(Reinforcement Learning)

이 부분은 따로 카테고리를 만들어서 정리 할 예정입니다.

요약

머신 러닝의 학습 유형

  • 지도 학습( Supervised Learning : SL )
    Regression(회귀) : 연속된 값을 통한 학습, ‘얼마나’를 예측.
    Classification(분류) : 연속적이지 않은 값을 통한 학습, ‘무엇’을 예측

  • 비지도 학습( Unsupervised Learning : UL )
    Clustering(그룹화) : 
    데이터의 특성에 따라 그룹화. 지도학습의 Classification과 다른 개념.

  • 강화 학습(  Reinforcement : RL )