Machine learning 1

독립변수와 종속변수

 

 

 


구슬이 서 말이라도 꿰어야 보배라는 말이 있지요?

데이터를 표에 가두는 것만으로는 부족합니다.

표 속에 구속된 데이터에서 의미있는 정보를
뽑아낼 수 있어야 합니다.


이에 능한 사람을 통찰력이 있다고 합니다.
단지 많이 아는 사람이 아니라,
통찰력 있는 사람이 되기 위해서는 대가가 따릅니다.

그 대가는 독립변수와 종속변수라는 말의 의미를 이해하는 것입니다.

이 말은 모델과 함께 우리 수업에서 가장 어려운 말입니다.
어렵지만 이 말을 이해하는 것은 충분한 경제성이 있습니다.

 

변수


변수는 영어로 variable이라고 합니다.
‘변할 수 있는'이라는 뜻이죠.

x=1
위와 같이 표시하면 이제부터 x는 1입니다.

x=2
이제 x는 2가 됩니다.

즉 x의 값은 달라질 수 있죠?

그래서 x를 변수라고 합니다.
이 변수라는 말을 표에서도 사용하곤 합니다.

누군가 표에 대해서 이야기하면서
변수를 언급하면 그것은 열을 이야기하는 것입니다.


예를 들어서 위의 표에서 온도의 값은
이렇게 달라지고 있습니다.

  • 온도 = 20
  • 온도 = 21
  • 온도 = 22


표에서 열을 왜 변수라고 하는지 아시겠지요?


 

독립변수 VS 종속변수

그럼 이제 ‘독립변수’와 ‘종속변수’에 대해서 이야기해봅시다.

'독립변수'와 '종속변수'…. 말이 정말 어렵죠?

저도 처음에는 그랬어요.
이렇게 바꿔보면 조금 편안하게 느껴질 거에요.

  • 독립변수 = 원인이 되는 열
  • 종속변수 = 결과가 되는 열



예를 들어 봅시다.

‘온도가 20도일 때 40잔이 팔렸다.’

여기서 원인은 온도 20도이고 결과는 판매량 40잔입니다.
잘 생각해보면 원인은 결과와 상관없이 일어나는 사건입니다.

판매량 때문에 온도가 달라질리가 없잖아요?

결과에 영향을 받지 않는 독립적인 사건입니다.
하지만 결과는 원인에 종속되어서 발생한 사건입니다.

그래서 원인은 독립적이기 때문에 ‘독립변수’,
결과는 원인에 종속되어 있기 때문에 ‘종속변수'라고 합니다.


이제부터 여러분은 독립변수와 종속변수를 배운 사람입니다.

배운 사람의 동공은 우왕좌왕하지 않습니다.

표를 만났을 때, 여러분의 머릿속에는
이 생각이 제일 먼저 떠올라야 합니다.

 

상관관계

‘이 표에 있는 특성(열)들 중에서
서로 상관있는 특성은 무엇이지?’

서로 상관있는 특성들은 이런 징후가 있습니다.

한쪽의 값이 바뀌었을 때, 다른 쪽의 값도 바뀐다면,
두 개의 특성은 ‘서로 관련이 있다’고 추측할 수 있습니다.

이 때, 두 개의 특성을 ‘서로 상관이 있다’고 합니다.
그리고, 이런 관계를 ‘상관관계’라고 합니다.

아래 표를 보시죠.

온도와 판매량은 서로 상관관계가 있다고
의심해볼 수 있습니다.
온도와 판매량이 같이 변하고 있거든요.

 

인과관계

그런데 잘 살펴보면 온도와 판매량 사이에 보다
미묘한 관계가 있는 것을 관찰할 수 있습니다.

이런 사실을 종합하면 ‘온도’는 ‘원인’이고,
‘판매량’은 ‘결과’라고 할 수 있습니다.



이렇게 각 열이 원인과 결과의 관계일 때
인과관계가 있다고 합니다.
 

상관관계와 인과관계는 비슷한 듯 하지만
중요한 차이가 있습니다.

아래 그림과 같이 상관관계는 인과관계를 포함합니다.

즉, 모든 인과관계는 상관관계입니다.
하지만, 모든 상관관계가 인과관계인 것은 아닙니다.

특성들 사이의 관계를 파악하는 것은 매우 어렵고,
조심스럽게 접근해야 하는 작업입니다.

적은 수의 데이터를 가지고 상관관계가 있다고
단정하면 안됩니다.

또 단지 서로 상관관계를 맺고 있을 뿐인데,
그것을 인과관계라고 단정해도 안 됩니다.




특성들 사이의 관계를 파악하는 일이란
실전에서는 매우 엄격한 기준을 가지고,
다양한 통계기법을 동원해야 하는 고되고,
중요한 작업이라는 점을 기억하세요.


정리해봅시다.
그럼 우리가 상상력으로 구현한 앱에는

어떤 데이터가 필요할까요?
그 데이터 중에서 어떤 것이 독립변수이고 종속변수일까요?

저는 아래와 같이 내용을 추가해봤습니다.


원인이 되는 온도는 독립변수가 되고,
원인의 결과인 판매량은 종속변수가 되는 것입니다.

이를 통해서 하고 싶은 일은
일기 예보 상의 온도(독립변수)를 보고
몇 개가 판매(종속변수)될지 예측하는 것입니다.



실습입니다.

앞에서 만든 기획서를 좀 더 정교하게 다듬어 봅시다.
독립변수와 종속변수를 기획서에 반영해서 제출해주세요.

 



축하합니다.

여러분은 익숙했던 표를 낯설게 바라보게 되었습니다.

특성, 개체, 독립변수, 종속변수와 같이
어려운 표현들도 이해할 수 있는 귀와 눈을 가지게 되었습니다.

앞으로 배우게 될 어떤 개념도
여러분의 눈썰미를 이렇게 극적으로
바꿔놓지는 못할 것입니다.


오늘 하루 잘 보내셨네요.
축하합니다.

댓글

댓글 본문
  1. 완료
  2. eu1357
    원인과 결과 완료
  3. 패니군
    완료
  4. popinbompin
    완료
  5. 문곰
    Done!
  6. 유갱05
    완료
  7. 조원배
    완료
  8. 김홍년
    완료~!
  9. 웨지
    완료
  10. Dennis
    독립변수, 종속변수, 상관관계, 인과관계
  11. Koo Goo
    완료
  12. 해인코딩
    완료
  13. Tae Hwan Yoon
    완료
  14. 이인규
    완료 08/28 23:10
    갑자기 보다가 다른 유튜브로 빠져버렸네 , 화이팅 !
  15. Helena
    학습 완료
  16. 더맨더머
    완료
  17. kinigre
    완료
  18. 지식탐구자
    완료
  19. 지식탐구자
    완료
  20. 오리궁디
    완료!
    독립변수, 종속변수
    인과관계, 상관관계
  21. 은하파파
    완료 2020-08-27
  22. 아혜
    완료
  23. 완료
  24. 박종희
    완료
  25. zi존코딩
    완료
  26. 저기요
    완료
  27. 차민기
    완료
  28. byoonn
    완료!
  29. yahyah
    완료
  30. 아나나
    완료
  31. 람지비전
    완료
  32. 리버풀
    수강완료
  33. 채시언
    완료
  34. dklklw;
    완료
  35. 완료
  36. 신종호
    완료
  37. 정종혁
    완료
  38. 완료
  39. 장정민
    2020.8.23 3:21

    '온도에 따라 판매량이 달라진다.'라는 말을 생각해보자. 여기서 온도는 '원인'이면서 독립적으로 행동하기 때문에 '독립변수'이고 '판매량'은 온도에 의해 달라지기 때문에 '결과', 즉 독립변수에 종속적이므로 '종속변수'에 해당한다. 이처럼 독립변수와 종속변수의 관계를 '인과관계'라고 하고, 더 크게는 '상관관계'라고 할 수 있다.
  40. 동동
    완료
  41. 신희영
    완료
  42. luis12
    완료
  43. mision82
    완료!
    다음 영상이 기대됩니다.
  44. Cathy Lee
    완료
  45. 완료
  46. 완료
  47. gossie
    아니땐 굴뚝에 연기나랴~~
    독립 변수 : 땔감, 종속변수 : 연기
  48. 행복
    완료
  49. 깡똘
    ^^완료
  50. MovingJoon
    클리어
버전 관리
egoing
현재 버전
선택 버전
graphittie 자세히 보기