Machine learning 1

독립변수와 종속변수

 

 

 


구슬이 서 말이라도 꿰어야 보배라는 말이 있지요?

데이터를 표에 가두는 것만으로는 부족합니다.

표 속에 구속된 데이터에서 의미있는 정보를
뽑아낼 수 있어야 합니다.


이에 능한 사람을 통찰력이 있다고 합니다.
단지 많이 아는 사람이 아니라,
통찰력 있는 사람이 되기 위해서는 대가가 따릅니다.

그 대가는 독립변수와 종속변수라는 말의 의미를 이해하는 것입니다.

이 말은 모델과 함께 우리 수업에서 가장 어려운 말입니다.
어렵지만 이 말을 이해하는 것은 충분한 경제성이 있습니다.

 

변수


변수는 영어로 variable이라고 합니다.
‘변할 수 있는'이라는 뜻이죠.

x=1
위와 같이 표시하면 이제부터 x는 1입니다.

x=2
이제 x는 2가 됩니다.

즉 x의 값은 달라질 수 있죠?

그래서 x를 변수라고 합니다.
이 변수라는 말을 표에서도 사용하곤 합니다.

누군가 표에 대해서 이야기하면서
변수를 언급하면 그것은 열을 이야기하는 것입니다.


예를 들어서 위의 표에서 온도의 값은
이렇게 달라지고 있습니다.

  • 온도 = 20
  • 온도 = 21
  • 온도 = 22


표에서 열을 왜 변수라고 하는지 아시겠지요?


 

독립변수 VS 종속변수

그럼 이제 ‘독립변수’와 ‘종속변수’에 대해서 이야기해봅시다.

'독립변수'와 '종속변수'…. 말이 정말 어렵죠?

저도 처음에는 그랬어요.
이렇게 바꿔보면 조금 편안하게 느껴질 거에요.

  • 독립변수 = 원인이 되는 열
  • 종속변수 = 결과가 되는 열



예를 들어 봅시다.

‘온도가 20도일 때 40잔이 팔렸다.’

여기서 원인은 온도 20도이고 결과는 판매량 40잔입니다.
잘 생각해보면 원인은 결과와 상관없이 일어나는 사건입니다.

판매량 때문에 온도가 달라질리가 없잖아요?

결과에 영향을 받지 않는 독립적인 사건입니다.
하지만 결과는 원인에 종속되어서 발생한 사건입니다.

그래서 원인은 독립적이기 때문에 ‘독립변수’,
결과는 원인에 종속되어 있기 때문에 ‘종속변수'라고 합니다.


이제부터 여러분은 독립변수와 종속변수를 배운 사람입니다.

배운 사람의 동공은 우왕좌왕하지 않습니다.

표를 만났을 때, 여러분의 머릿속에는
이 생각이 제일 먼저 떠올라야 합니다.

 

상관관계

‘이 표에 있는 특성(열)들 중에서
서로 상관있는 특성은 무엇이지?’

서로 상관있는 특성들은 이런 징후가 있습니다.

한쪽의 값이 바뀌었을 때, 다른 쪽의 값도 바뀐다면,
두 개의 특성은 ‘서로 관련이 있다’고 추측할 수 있습니다.

이 때, 두 개의 특성을 ‘서로 상관이 있다’고 합니다.
그리고, 이런 관계를 ‘상관관계’라고 합니다.

아래 표를 보시죠.

온도와 판매량은 서로 상관관계가 있다고
의심해볼 수 있습니다.
온도와 판매량이 같이 변하고 있거든요.

 

인과관계

그런데 잘 살펴보면 온도와 판매량 사이에 보다
미묘한 관계가 있는 것을 관찰할 수 있습니다.

이런 사실을 종합하면 ‘온도’는 ‘원인’이고,
‘판매량’은 ‘결과’라고 할 수 있습니다.



이렇게 각 열이 원인과 결과의 관계일 때
인과관계가 있다고 합니다.
 

상관관계와 인과관계는 비슷한 듯 하지만
중요한 차이가 있습니다.

아래 그림과 같이 상관관계는 인과관계를 포함합니다.

즉, 모든 인과관계는 상관관계입니다.
하지만, 모든 상관관계가 인과관계인 것은 아닙니다.

특성들 사이의 관계를 파악하는 것은 매우 어렵고,
조심스럽게 접근해야 하는 작업입니다.

적은 수의 데이터를 가지고 상관관계가 있다고
단정하면 안됩니다.

또 단지 서로 상관관계를 맺고 있을 뿐인데,
그것을 인과관계라고 단정해도 안 됩니다.




특성들 사이의 관계를 파악하는 일이란
실전에서는 매우 엄격한 기준을 가지고,
다양한 통계기법을 동원해야 하는 고되고,
중요한 작업이라는 점을 기억하세요.


정리해봅시다.
그럼 우리가 상상력으로 구현한 앱에는

어떤 데이터가 필요할까요?
그 데이터 중에서 어떤 것이 독립변수이고 종속변수일까요?

저는 아래와 같이 내용을 추가해봤습니다.


원인이 되는 온도는 독립변수가 되고,
원인의 결과인 판매량은 종속변수가 되는 것입니다.

이를 통해서 하고 싶은 일은
일기 예보 상의 온도(독립변수)를 보고
몇 개가 판매(종속변수)될지 예측하는 것입니다.



실습입니다.

앞에서 만든 기획서를 좀 더 정교하게 다듬어 봅시다.
독립변수와 종속변수를 기획서에 반영해서 제출해주세요.

 



축하합니다.

여러분은 익숙했던 표를 낯설게 바라보게 되었습니다.

특성, 개체, 독립변수, 종속변수와 같이
어려운 표현들도 이해할 수 있는 귀와 눈을 가지게 되었습니다.

앞으로 배우게 될 어떤 개념도
여러분의 눈썰미를 이렇게 극적으로
바꿔놓지는 못할 것입니다.


오늘 하루 잘 보내셨네요.
축하합니다.

댓글

댓글 본문
  1. 강철무지개
    잘 봤습니다.
  2. 쿠션머리
    20240207 완료
  3. 킴해롤
    20240207 시청완료
  4. nathan
    2024.02.07 - 완료
  5. 커비커비
    2024.01.24 - 완료
  6. labis98
    20231230
  7. 시아네스
    231024.
  8. 코딩두
    23.07.23
    원인은 독립적이기 때문에 독립변수
    결과는 원인에 종속되어 있기 때문에 종속변수
    둘은 관련이 있기에 상관관계
    인과관계는 상관관계에 포함됨

    # 정리하자면 ->
    독립변수는 원인이다
    종속변수는 결과다
    독립변수와 종속변수의 관계를 인과관계라 한다
    인과관계는 상관관계에 포함된다
  9. 쿡보라
    좋아요오~
  10. 규빈이아빠
    완료
  11. 소나무55
    완료
  12. 미르
    22.8.4
  13. 파괴왕파파괴
    독립변수 그날의 온도로 종속변수인 필요한 레몬의 예상 갯수를 설명하려 하는 데이터셋이군요!
  14. kwaife
    완료
  15. 솔나무
    독립변수은 원인, 종속변수는 결과
    모든 인과관계는 상관관계다. 모든 상관관계는 인과관계가 아니다
  16. 문주홍
    완료
  17. 라비린토스
    완료
  18. 대광어
    완료
  19. 네코네코
    완료.
  20. Ju-won Lee
    완료
  21. 팔복홈
    오래간만에 들어보는 용어들 쉽게 이해했습니다.
  22. 독수리500타
    완료
  23. 당근
    완료!
  24. 대니얼
    완료!
  25. yeong
    문명의 이기로 내 삶을 윤택하게 편안하게
  26. Yu Han Noh
    완료
  27. 찌람
    완료했습니다!!
  28. 제스프리
    완료
  29. 윤도기
    21/07/28 완료
  30. 다은a
    완료
  31. 펭귄해
    완료
  32. 비야날다
    완료!
  33. 이대현
    완료!
  34. 늦은 학생
    완료
  35. 아아하하
    완료
  36. 최지원
  37. 다시 봐야할것같지만 일단 1회차 순서대로...보기...
  38. fladi
    완료!!!
  39. 완료
  40. Yunkyeong Jang
    완료
  41. HyeonHui Jeong
    완료
  42. 코린이
    완료
  43. Karen
    Shut up and Go
  44. 김영환
    완료
  45. 나건
    완료
  46. 형광펜
    완료
  47. smjsih
    완료
  48. 찐찐
    완료!
  49. 완료
  50. jeseung
    완료!
버전 관리
egoing
현재 버전
선택 버전
graphittie 자세히 보기