[Decision Theory]
사람은 결정장애를 긔찮아 하기 때문에
머신러닝 한다는 것은
결정해주는 기계를 만드는 일이라 하였음
그래서 오늘은
결정하는 단순한 기계(M)를 만들어 봄
이것은 수학 식으로 '표현'을 하기 위한 것이지
문제를 '풀어'서 정답을 맞추기 위한 것이 아님
푸는 것은 나중이고
표현이 먼저임
음악적인 표현 문학적인 표현이 있듯이
수학적인 표현 이라는 것도 있는 것임
그래서 표현 을 해봄
표현이란
예쁘게 표현되면 좋은 것이고
못되게 표현되면 나쁜 것인데
그냥 그게 다임
답맞추기하는것이 아니므로
틀릴까봐 긴장을 하면 아니됨
가장 먼저 표현하여 볼 것은
수평으로 갈라진 위와 아래임
위쪽은 future라고 쓰여있어서 아직 모르는 거고
아래쪽은 past라고 쓰여있어서 과거 인데
future와 past의 사이를 가로지르는
착한 사람에게만 보이는 아주 가느다란 선이
현재(present) 임
미래는 매우 불확실한 것인데
'결정된 미래=과거' 이라는
심오한 우주론적인 철학을 가지고 있는 기계 M인 것임
그래서
M은 회색으로 포장된 공을 많이 가지고 있는데
공마다 x라는 글자가 쓰여있음
수학에서 x란 대체로, '모른다' 고 말할 때 사용함
M은 회색의 공 x를 위로 푱 쏘는,
그래서 위쪽에 있는 N개의 구역 중에 어디엔가로 보내는 결정을
사람 대신에 해주는 기계임
공을 일단 쏜 다음에는
쏘아진 공을 갖다가
키세스 초코렛 껍데기 까듯이 포장을 까보면
회색의 껍데기 속에는
실은 빨간색(r), 초록색(g) 등등의 색깔이
실제로 들어있는 것임
근데 기계는 쏘기 전에는 그것이 다 회색으로 보임
그래서 사람 대신에 결정장애를 겪어주는 고마운 친구임
하나 유의할 것은
여기 그려놓은 기계는 future 지역의 일에 일절 관여하지 않음
그래서 공을 쏘고 나서는
결과는 나몰라라 하고
다음 공이나 주섬주섬 쏘고 그러는
매우 단순한 기계임
나중에 알아볼 안단순한 기계는
공을 쏘고 나서
결과를 나몰라라 하지 않기도 함
쏜 뒤의 결과를 잘 봐서 자기수리를 해갖고
공을 다시 쏴갖고 더 나은 결과를 내고 그렇슴
근데 오늘의 포스팅에서는
자기수리능력이 없는
멍청한 기계를 갖다가 놓은 것임
쏘기만 하고 뒷일은 모름
사진에는 알파벳이 참 가지가지 있는데
각각의 알파벳의 의미를
하나하나 읊어봄
α
alpha 라고 읽는 이 글자는
뭐라고 결정할까 하는 것임
alpha_1이면 1번 구역으로 결정한다는 '행위'를 말하는 뜻이고
alpha_2이면 2로 구역으로 결정한다는 '행위'를 말하는 뜻임
i, k
i 는 기계가 결정한 번호를 의미하고
k는 공을 까봤을때 나오는 정답의 번호을 의미함
만약 i가 k와 같으면 => '정답을 맞췄다' 라는 말이고
만약 i가 k와 다르면 => '정답을 틀렸다' 라는 말이 됨
λ
한자로 들 입 자 (사람인 자랑 비슷한) 처럼 생긴 글자는
그리스 문자 Lambda라고 부르는 친구인데
Risk(위험도) 를 표현해줌
기계(M)이 정답을 맞추었을 때 보상 혹은
정답을 틀리었을 때 벌금을 표시하는 개념임
그래서
만약 i가 k와 같으면 => '정답을 맞췄다' =>벌금 0원이라는 말이고
만약 i가 k와 다르면 => '정답을 틀렸다' =>벌금 λ원 이라는 말이 됨
아래첨자가 있는 λ는 아직 정해지지 않은 변수 이고
아래첨자가 없는 λ는 값이 정해진 (100원이든 200원이든) 상수 임
P(C_k | x)
이것은 x라는 공을 까봤을때 답이 k일 확률 임
기계 M에는 확률값이 세팅이 되어 있어서
x가 실은 r일 확률이 1/5
x가 실은 g일 확률이 2/ 7
이런 식으로 사전 정보가 확률적으로 주어져 있음
확률이므로 불확실하고
그렇기 때문에 애초부터 결정장애를 겪고 앉았는 것임
확률로 주어지지 않고 모든 것이 착착착 확실하다면
사람이고 기계고 간에
이렇게 결정장애로 골을 싸맬 이유가 없음
또한 여기서는 구체적인 확률 수치도 주지 않았음
우리는 상황을 ‘표현’하고 있는 것이기 때문에
구체적으로 어떤 숫자가 들어가는지는 나중 문제임
질문이 나올 수가 있는데
공을 쏴본적이 없는 주제에
확률이 1/5 인지 2/7인지 4/9인지
뭐일지를 어떻게 앎?
모름
이것은 매우 단순한 기계이기 때문에
정해진 확률대로만 쏨
근데 나중에 알아볼 안단순한 기계는
쏜 다음의 결과를 잘 봐갖고
자기 확률을 보정해서 다음번에 다시 푱 쏘고 함
그러면 공이 더욱 알맞은 곳에 들어감
그것을 어려운 말로
파라미터 튜닝(parameter tuning) 이라고 부름
머신러닝(machine learning)에서
한국말로 '배운다' 고 번역되는 'learning' 이라는 단어는
기계가 결과를 까본 다음에
자기수리를 해갖고 스스로를 개선한다는 소리를
곱상하게 일컫는 것임
그러므로 지금 만들고 있는 기계 M은
엄밀하게 말해서 learning을 하는 기계가 아닌 것임
(잘 안맞을게 뻔하도록) 정해진 확률대로만 푱푱 쏘는 친구이기 때문
아무튼
다음 알파벳을 계속 설명해봄
R(alpha_i | x)
이것은 Expected Risk라는 놈인데
x라는 공을 손에 들고서 alpha_i라는 결정을 내렸을 때의 리스크(위험도) 라는 뜻임
그래서 Expected Risk는
선택 i를 하고 정답이 k일 때 Risk와,
정답이 k 일 확률을 곱해서 만들어짐
근데 정답은 1일수도 2일수도 3일수도… N일수도 있기 때문에
모든 가능성을 고려해서 더해주는
덧셈 (시그마) 표시가 있는 것임
왼쪽으로 누운 M자 모양이 시그마 표시임
그래서 M이라는 것은
결정하는 기계(Machine) 라고 했음
결정하는 기준은 뭐냐면
'Choose \alpha_i if ...' 하고 영어문장이 쓰여있는 것을 보시면 되겠음
min 이라는 것은 최소값(minimum) 이라는 뜻임
결정이라는 것은 답을 알고 하는게 아니라
답을 모르고서 하는 것임
정답에 대한 정보를 모르는데
결정을 어떻게 하냐면
규칙에 따라서 함
그 규칙이라는 것이 매우 합리적인데
기대되는 R(alpha_i | x) (=expected risk)
중에서 최소값을 주는 Risk를 골라서
그게 i라고 한다면
i번째 구역으로 쏘라(α)
는 규칙임
쉽게 말해서
‘결정에 따르는 리스크가 가장 작은 구역을 향해서’
‘쏘라(α)’
고 하는
사실은 사람 말로 하자면
매우 뻔하디 뻔한 결정을 말하는 것임
근데 수학말로 하면
골이 좀 아파짐
근데 계속 아프면서 계속 하다 보면
그래도 계속 아프긴 한데
오해가 없는 표현을 만들어낼 수가 있음
수학은 골이 아프다는 단점이 있지만
그 정밀함 때문에
제대로만 표현되었다면
누가 읽든지 '오해'를 하지 않게 됨
반면에 사람 쓰는 일반 언어는
사용하는데 골은 안아프지만
정밀하지가 않아서
아무리 마음을 잘 표현하려 애써도
항상 어느정도 오해를 불러일으키는 것임