본문 바로가기

ML

통계적 관점에서의 머신러닝

귀납적 추론과 통계의 관계


귀납적 추론이란, 개별적인 사실로부터 일반적인 결론을 이끌어내는 추론법이다.
귀납적 추론으로 가장 잘 알려진 예시를 살펴보자.

개별적 사실 1 : 맹자는 죽었다. 
개별적 사실 2 : 소크라테스도 죽었다.
일반적 결론 : 그러므로 모든 사람은 죽는다.

이때 도출한 결론인 '그러므로 모든 사람은 죽는다'는 사실일수도 있지만 거짓일수도 있다.
(모든 사람에 대한 개별적 사실이 있는 것이 아니므로)
여기서 알 수 있다시피, 귀납적 추론에 의한 결론은 불확실성(uncertainty)를 가지고 있다.
그리고 이 불확실성은 확률로 측정을 할 수 있다.
eg. 그러므로 모든 사람은 죽는다. (uncertainty : 0.001)

cf. 이때, 불확정성을 측정하는 확률을 어떻게 계산할 수 있을까?🤔
다양한 방법이 있겠지만 한가지 예시로 '신뢰구간' 이라는 개념을 사용할 수 있다.
간단히 말하자면, [우리가 추정하려는 실제 값이 구간(a,b)에 있을 확률이 95%이다.]는 결론을 도출하는 방법이다.

 


귀납적 추론을 통계의 관점에서 본다면?


귀납적 추론의 '일부로 전체를 판단한다'는 부분을 통계의 관점에서 본다면, 
표본의 통계량으로 모집단(전체)의 통계량을 예측하는 '추정'으로 해석할 수 있다.
eg. 추정의 예시 : 전체 학생이 10명인 학급에서 학생 5명의 성적 평균이 75이므로, 전체 성적 평균은 75일 것이다.

* 추론과 추정이 헷갈린다면, 추론은 Inference, 추정은 Estimation을 이해하면 된다.

 



추정 in Machine Learning


통계학에서 사용되는 추정은 머신러닝에서도 적용되는 개념이다.
머신러닝의 학습 과정은 아래와 같다.
step1 : 주어진 데이터로 학습
step2 : 처음 보는 데이터를 판단
step3 : 예측한 값과 정답의 차이를 계산하고, 이 차이를 최소화하는 방향으로 모델 조정
step4 : step1로 돌아가기

머신러닝에서 통계적 관점을 채택하면, step1의 '학습' 과정은 주어진 데이터로 전체 분포를 예측하는 과정이 된다.
예를들어 아래와 같은 마리오 주사위 주사위에 대해, (from. 마리오 파티)


step1 : 확률적 관점을 채택한다면, 이때의 학습은
일부 데이터 (학습에 사용되는 데이터)를 토대로 전체 데이터의 분포를 예측하는 과정이다.
예를들어, 학습에 사용되는 데이터로 '마리오 주사위를 15번 던지는 시행을 했을 때 주사위 눈의 합(표본평균)'이 1000개 주어진다고 하자. 
모델은 주어진 데이터를 토대로 아래와 같은 하나의 분포를 만든다.



step2 : 실제로 마리오 주사위를 15번 던지는 시행을 n번정도 해본다.

step3 : 우리가 예측한 확률 분포가 실제로 값을 가장 잘 설명하는 분포가 되도록, 확률분포를 수정한다.
이때, 주로 MLE 추정을 사용한다.
MLE 추정은 실제 값이 특정 확률분포에 포함될 확률을 최대화 하는 변수를 구하는 추정이다.

https://recipesds.tistory.com/entry/최대우도추정법MLE을-산수를-곁들여-즐기는-향유

여기까지가 통계적 관점을 채택한 머신러닝에서의 학습 방법이다.
물론 이 이후에 모델을 보정하기 위해 Gradient Descent 라던지, 이를 계산하기 쉽게하기 위해 역전파를 한다든지 등 복잡한 과정이 남아있지만, '통계가 ML에 위와 같이 적용될 수 있다' 정도만 기억하고 넘어가면 될 것 같다.

 


정리

너무 간단한 예시를 들어서 ML의 학습 과정이 와닿지 않을 수 있지만,.
핵심은 '주어진 데이터로 전체 확률분포를 예측하는' 추정 즉, 귀납적 추론이 머신러닝에서도 사용된다는 것이다.
이처럼 확률적 관점으로 머신러닝을 바라본다면, 단순히 몇개의 레이어로, 혹은 무슨 모델로, 등와 같이
구조적인 것을 넘어서서 머신러닝을 더 깊이있게 이해할 수 있게 된다. 
일례로, 머신러닝에서 Loss fuction으로 자주 사용되는 cross-entropy함수도, 통계에서 사용되는 Maximum Likelihood에 의해 유도된 것이다.

여기까지의 내용을 정리하자면, 아래와 같다.
1) '표본으로 전체를 예측한다'는 부분에서, 통계학에서의 추정과 ML은 같은 맥락이라할 수 있다.
2) 이 관점을 채택하면, 통계학에서 사용하던 여러 이론과 기법들을 ML에서도 적용할 수 있게 된다.

'ML' 카테고리의 다른 글

[ML] 데이터 증강 (Data Augmentation)  (0) 2022.03.27
[ML] 교차 검증  (0) 2022.02.20
[ML] Fashion MNIST  (0) 2022.02.13
[ML] 타이타닉 생존자 예측하기  (0) 2022.01.30
[ML] CNN  (0) 2022.01.23