관리자

machine learning은 3가지로 분류할 수 있다.

 

1-2. machine learning의 분류

 

 

출처: https://www.slideshare.net/milkers/lecture-06-marco-aurelio-ranzato-deep-learning


1) supervised learning(지도 학습)

정답이 있는 경우의 학습 방법이다.

 

supervise: 감독하다, 감시하다, 관리하다

supervised learning이 지도 학습으로 번역되는 것은 감시보다는 감독, 관리의 의미가 강하기 때문인 것 같다.

감독관이 지도를 하는 것처럼 supervised learning은 정답에 대한 방향을 지도하는 학습 방법이다. 

정답을 아는 데이터(labeled data)를 통해 정답과 오답에 대한 기준(model)을 학습한다.

 

이전 글에서 손글씨를 인식하는 경우가 supervised learning에 해당한다.

손글씨 사진이 실제로 어떤 글자를 나타나는지가 label이며, 정답에 해당한다.

많은 (손글씨 사진 + 사진 속 실제 글자(label)) 데이터를 가지고 모델을 만든다.

 

 

classification(분류), regression(회귀분석)에 이용된다.

 

NN이 supervise learning에 속한다

 

2) unsupervised learning(비지도 학습)

반대로 unsupervised learning은 정답이 없는 경우의 학습 방법이다.

정답이 없기 때문에, 통계학의 밀도 추정(density estimation)과 연관이 깊다.

 

clustering과 dimension reduction(차원 축소)이 대표적인 예시이다.

 

 

3) reinforcement learning(강화 학습)

reinforcement learning에서 supervised learning, unsupervised learning과는 조금 다른 학습 방법이다.

reinforcement learning은 reward(보상)을 통해 reward의 합이 최대가 되는 방향으로 학습하는 것이다.

강화학습은 environment와 agent가 서로 상호작용하면서 일어난다.

t시점에서, 상태(S_t)일 때 agent가 action(a_t)를 하면 reward(R_t)를 받는다.

S_t일 때, a_t를 하면 받는 R_t는 사전에 정해져있다.

강화학습의 목표는 처음 상태(initial state)에서 목표 상태(goal state)에 도달할 때까지 받는 reward가 최대가 되도록 하는 것이다.

+ Recent posts