QA : 8
DATA SCIENCE : 27
TABLE : 6
TERM : 3
eISSN 0000-0000

[ QA ]

Frequentist에게 “귀무가설”이 있다면 Bayesian에게는?

CONTENTS

Bayesian에게는 “사전확률”이 있습니다.

Frequentist와 Bayesian은 누구?

  • Frequentist(프리퀀티스트, 빈도주의자)은 빈도주의 접근법을 따르는 사람입니다. 이들은 확률을 반복 실험에서 나타나는 빈도로 해석하며, 주어진 데이터를 통해 객관적인 추론을 수행합니다. 사전확률을 사용하지 않으며, 데이터 자체에 기반하여 가설을 검정하고 신뢰구간을 추정합니다.
  • Bayesian(베이지앙, 사후확률추구자)은 베이지안 접근법을 따르는 사람입니다. 이들은 확률을 주관적인 믿음의 정도로 해석하며, 새로운 증거를 사용하여 사전확률(prior probability)을 사후확률(posterior probability)로 갱신합니다.
베이지안은 데이터 생성기, 프리퀀티스트는 데이터 계수기

두 주의자의 관점 비교

모수($\bf \theta$): 개체를 생성하는 확률분포의 매개변수

  • 프리퀀티스트: 모수의 확률분포형태와 모수에 대한 귀무가설과 귀무가설의 기준인 유의수준을 정하는 것으로 모수에 관한 가설의 검정 시작
  • 베이지안: 모수의 사전확률분포를 정하는 것으로 모수에 관한 추론 시작

p값과 가능도

  • 프리퀀티스트: p값은 귀무가설이 참 일때 관측된 데이터보다 더 극단적인 데이터를 얻을 확률. 주어진 유의확률과 확률분포에서 계산.
  • 베이지안: 가능도($\left(P({\bf D} \mid {\bf \theta})\right)$)는 주어진 모수 하에서 데이터를 관측할 확률이며 주어진 사전확률$\left(P({{\bf D} \mid \bf \theta})\right)$과 결합하여 사후확률$\left(P({\bf \theta} \mid {\bf D})\right)$을 계산, 즉, 사후확률은 데이터에 의해 사전확률이 갱신된 확률. 

최우추정법(MLE)과 최대사후확률추정법(MAP)

  • 프리퀀티스트: MLE(Maximum Likelihood Estimation)는 데이터를 가장 잘 설명하는, 즉, 가능도가 최대인 모수를 찾는 방법
  • 베이지안: MAP(Maximum A Posteriori)는 사전확률과 가능도를 결합하여 사후확률을 최대화하는 모수를 찾아가 방법

주사위에 대한 접근 방법의 차이는?

  • Bayesian 접근 방식은 주사위의 사전확률분포를 새로운 데이터를 통해 사후확률분포로 계속 갱신합니다.
  • Frequentist 접근 방식은 주사위를 굴려서 얻은 데이터를 통해 주사위의 확률분포를 구합니다.