맥주는 손 맛

t분포 (윌리엄 고셋의 필명을 따서 Student t분포라고도 함)


기네스 맥주의 맛은 t분포 덕분입니다.

t분포는 기네스 맥주회사의 윌리엄 고셋(William Gosset)의 이름을 따서 만들어졌습니다. 당시에는 표본크기가 150개 정도의 표본으로 모집단의 모수를 추정하는 것이 일반적이었는데, 윌리엄 고셋이 처한 현실에서는 작은 표본크기로 이상적인 홉의 비율을 추정해내야 했습니다. 참고로, 기네스 사는 경쟁사들보다 뛰어난 품질관리를 위해 대학에서 과학과 수학을 전공한 인재를 정식으로 채용했는데, 이는 ‘맥주는 손맛’이라고 생각하던 당시에는 매우 파격적인 전략이었습니다.

 

그런데, 표본의 크기가 작은 경우, 표본의 분산이 모집단의 분산에 비해 작아집니다. 따라서, 작은 표본의 통계량으로 모수를 타당하게 추정하기 어렵습니다.

 

윌리엄 고셋은 소표본의 분포와 분산을 조사하던 중, 그 분포가 칼 피어슨(Karl Pearson)의 카이제곱 분포와 연관이 있음을 발견하고, 표준정규분포와 카이제곱 분포의 비율인 t분포를 만들게 됩니다. 이로써 표본크기가 작아도 모집단을 추정할 수 있는 길이 열리게 됩니다.

 

위의 애니메이션을 보시면, 표본크기가 작은 경우의 t분포는 정규분포에 비해 더 퍼져있는 것을 보실 수 있습니다. 그러다가 표본크기가 30에 가까워지면, 정규분포에 가까워집니다.

 

참고로, 윌리엄 고셋은, 기네스 맥주회사의 내부 보안 방침에 저촉되지 않도록, 이러한 연구결과를 자신의 필명인 Student로 Biometrika라는 학술저널에 발표하였고, 훗날 이 논문 속의 분포를 “Student’s distribution”이라고 부른 로날드 피셔(Ronald Fisher)에 의해 널리 알려지게 되어, Student t 분포가 되었습니다.