한 페이지 머신러닝

머신러닝이 할 수 있는 일

분류 (Classification)

지능이 작용함을 판별하는 한 가지 기준은, 사물을 '분류' 할 수 있는가 하는 것입니다.
사물 A와 B 를 분류하기 위해서는
그 대상의 고유함을 정의하는데 유용한 '특징(Feature)'을 발견할 수 있어야 합니다.
예컨대 사각형은 꺾어진 부분이 네 군데라서 삼각형과 다르다든지 하는 식으로 말이죠.
사람은 이것을 곧잘 하지만
컴퓨터가 분류 문제를 푸는 것은 매우 어렵습니다.
데이터로부터 특징을 '발견'해야 하니까요.
시키는 것만 할 줄 아는 컴퓨터에게
'발견하는 법'을 가르치기란 참 막막한 일이죠.

Image result for classification icon

예측 (Prediction)

지능의 두 번째 기준은, '예측'을 할 수 있는가 하는 것입니다.
이전에 발생했던 일들로부터 어떤 '특징(Feature)'을 포착해야만
이후에 유사한 특징이 또 일어나는지 보고, 이전의 그것과 유사한 결과를 낼 것이라고 예측할 수 있으니까요.
그것이 분류 문제이든 예측 문제이든
현상으로부터 '특징'을 어떻게 잘 발견할 것인가 하는게 
머신러닝 문제의 핵심 질문이라고 볼 수 있습니다.

Image result for prediction icon

진격의 딥러닝

머신러닝의 역사는 오래 되었지만
그중에 특히 딥러닝이 오늘날 이토록 각광을 받게 된 시초가 되는 사건이 2012년에 일어났는데요.
Imagenet이라는, 이미지 분류 문제를 푸는 대회에서 
SuperVision group의 Alex KrizhevskyGeoffrey HintonIlya Sutskever
84.7%의 분류 정확도를 선보이면서 경쟁자들을 압도적인 격차로 따돌리고 우승한 사건입니다.
이 때 이미지 분류 오차율 차이는 1위와 2위가 10.8% 였는데요.
전세계의 인재들이 단 0.1%라도 더 올리려고 각축을 벌이는 대회에서 10.8% 차이를 보였다는 것은
매우 충격적인 사건이었죠.

AlexNet

AlexNet은 합성곱 신경망(Convolusional Neural Network)의 일종으로,
지금은 개선이 많이 되어 오리지널 모델은 잘 쓰이지 않지만,
딥러닝 붐을 일으킨 장본인으로 역사에 남게 된 모델입니다.

Image result for alexnet
AlexNet
딥러닝 이전의 머신러닝

ImageNet 사건 이전의 이미지 분류 문제를 푸는 머신러닝 모델들은,
아주 정제된 데이터가 갖추어진 환경에서 잘 해야 70%대의 정확도를 보였습니다.
이 말은 10번의 시도 중 최대 7번이 정답이고 3번은 틀린 답을 내놓는다는 뜻입니다.
때문에 이 정확도 수준의 머신러닝이 적용될 수 있는 산업군에는 제한이 있었습니다.
기상예측, 책이나 의류 추천 등
맞으면 좋지만 틀려도 큰 문제는 되지 않는 산업에만 적용될 수 있었지요.
주로 전문가의 의사결정을 돕는 추천 시스템에 적용될 수 있었습니다.
이때의 머신러닝을 활용해서는
최종 결정은 오직 사람만이 내리며,
컴퓨터는 단지 사람의 업무량을 줄이는 정도의 도움을 줄 수 있었습니다.

추천 알고리즘의 시대

추천 알고리즘을 단순하게 놓고 본다면
협업 필터링(Collaborative Filtering)과 컨텐츠 기반 필터링 기법을 생각할 수 있는데요.

협업 필터링은,
사람 A와 B의 성향이 평소 유사하다면,
A가 고른 물건을 B에게도 권유하는 방식입니다. 

컨텐츠 기반 필터링은,
문서 A와 B가 유사하다면,
A를 고른 사람에게 B도 권유하는 방식입니다.

단순해 보이지만
사실은 유사도(Similarity)를 어떻게 정의할 것인가에서부터
추천이 잘 되었는지를 어떻게 판단할 것인가 하는 문제도 쉽게 답을 내릴 수 있는 것은 아니지요.

또한, 사람의 특징이든 컨텐츠의 특징이든,
각 분야마다의 특징 이라는 개념을 사람이 일일이 발견해서 컴퓨터에게 정확한 지시를 내려주어야만 작동했습니다.
제조업이든 유통업이든, 각각의 산업군마다 '특징' 이라는 것은 각기 다르기 마련이므로
특징을 일일이 발견하고 정리하여 컴퓨터가 알아들을 수 있는 언어로 만들어주는 사람인
지식공학자(Knowledge Engineer)라는 역할도 있었지요.

Image result for collaborative filtering content based filtering

딥러닝 이후의 머신러닝

AlexNet사건 이후 머신러닝 기술은 급속도로 상향 평준화되기 시작합니다. 
80%대, 90%대 성능도 자주 나오고,
사람의 수준을 넘어서는 95%이상의 정확도도 심심치 않게 내놓을 수 있게 되었죠.
10번중에 1번 틀릴까 말까 한 수준의 정확도가 되어서
이것을 적용할 수 있는 산업군은
사람에게 매우 중요하고 결정적인 범위를 포괄하게 됩니다.
의료, 금융, 자율주행 자동차와 같은 중요한 영역에도 머신러닝이 적용될 수 있는 시대가 열린 것입니다.

자동차에게 운전을 맡겼더니 10번 중 3번의 판단 오류를 낸다면 그것은 큰 사고로 이어지지만
10번 중 1번 오류를 낼까 말까 하는 정확도라면
이제는 사람이 운전대를 놓고 컴퓨터에게만 맡겨도 안전하다는 뜻이니까요.

또 사람의 자연어(Natural Language)도 기계가 정밀하게 흉내낼 수 있게 되면서
콜센터 직원이라든지, 사람과 대화하는 인공지능 스피커라든지 하는
이전에는 넘볼 수 없었던 정확성을 요하는 영역에도
머신러닝이 진출할 수 있게 되었습니다.

인공지능의 진화

사람의 지능이 할 수 있는 분류(Classification)와 예측(Prediction)을 잘 해보자고 발달한 인공지능이
이제는 창조주인 사람을 넘보는 수준에 이르고 있습니다.
현상(데이터)으로부터 유의미한 '특징'을 발견할 줄 알게 되면서
새로운 세상이 열린 것이죠.
앞으로 우리의 미래는 과연 어떻게 될까요?

댓글

댓글 본문
작성자
비밀번호
버전 관리
Woneui Hong
현재 버전
선택 버전
graphittie 자세히 보기