아래 그림은 머신러닝에 속해있는 여러 분야를
정돈된 형태로 보여줍니다.
5분간 바라봅시다.
이 이미지를 머릿속에 그리고 학습하는 것과
그렇지 않은 것은 큰 차이가 있습니다.
과속하지 마세요.
막막하죠?
막막할 때는 비유가 특효약입니다.
비유를 통해서 머신러닝의 여러 분야들과
가벼운 인사를 나눠봅시다.
그전에 한 가지 분명히 할 것이 있습니다.
비유는 비슷한 것일 뿐, 진실이 아닙니다.
이 상태에 계속 머물러 있으면 안 됩니다.
비유를 진실로 대체하려는 노력을 하거나,
진실이 아니라는 사실을 기억하고
항상 열린 마음을 유지해주세요.
지도학습의 ‘지도'는
기계를 가르친다(supervised)는 의미입니다.
마치 문제집을 푸는 것과 비슷합니다.
문제집에는 문제가 있고, 정답이 있습니다.
문제와 정답을 비교하고 맞추다 보면
문제풀이에 익숙해지게 됩니다 .
이후에 비슷한 문제를 만나면
오답에 빠질 확률은 점점 낮아집니다.
문제집으로 학생을 가르치듯이 데이터로
컴퓨터를 학습시켜서 모델을 만드는 방식을
‘지도학습’이라고 합니다.
앞서 살펴본 손톱 감시 앱과 레모네이드 판매량 예측 작업은
지도학습을 이용한 것입니다.
비지도학습은 지도학습에 포함되지 않는 방법들입니다.
여기에 속하는 도구들은 대체로 기계에게 데이터에 대한
통찰력을 부여하는 것이라고 이야기할 수 있을 것 같습니다.
'통찰'의 사전적 의미는 '예리한 관찰력으로
사물을 꿰뚫어 봄'입니다.
즉, 누가 정답을 알려주지 않았는데도
무언가에 대한 관찰을 통해 새로운 의미나 관계를
밝혀내는 것이라고 할 수 있습니다.
데이터의 성격을 파악하거나 데이터를
잘 정리정돈 하는 것에 주로 사용됩니다.
이해가 안 되죠?
안되는게 정상입니다.
그러니 걱정하지 마세요.
뒤에서 자세히 살펴봅니다.
강화학습은 학습을 통해서 능력을 향상시킨다는 점에서는
지도학습이랑 비슷합니다.
차이점은 지도학습이 정답을 알려주는
문제집이 있는 것이라면,
강화학습은 어떻게 하는 것이
더 좋은 결과를 낼 수 있는지를
스스로 느끼면서 실력 향상을 위해서
노력하는 수련과 비슷합니다.
경험을 통해 “더 좋은 답”을 찾아가는 것입니다.
마치 게임 실력을 키우는 것처럼요.
게임에는 룰이 있고, 룰에 따라 어떤 행동을 하면,
그 결과에 따라서 상이나 벌을 받습니다.
더 큰 상을 받기 위한 과정을 끝없이 반복하다 보면
그 게임의 고수가 됩니다.
이런 과정을 기계에게 시켜서
기계 스스로가 고수로 성장하도록
고안된 방법이 강화학습이라고 할 수 있습니다.
정리해봅시다.
아래의 물음에 대답해보세요.
과속하지 마시고,
입속으로 옹알옹알 해보세요.
이걸 계속하다 보면
‘나 이거 뭔지 알아'라는 느낌이 들 거예요.
그때가 진도를 나갈 타이밍입니다.
그럼 이제 각각의 방법들에 대해서
좀 더 자세히 살펴봅시다.