t변환
t transformation
1.1. 자유도를 1에서 50까지 변화시키면서 t분포 관찰
2.1. t변환
4.1. 용어
1. 애니메이션
2. 설명
2.1 t변환
확률변수 $X$를 가지는 집단에서 추출한 크기 $n$인 표본의 표본평균도 확률변수가 되며 $\bar X$로 표시합니다. 표본의 표본표준편차는 $S_X$로 표시합니다. 집단의 모평균은 $\mu_X$, 모표준편차는 $\sigma_X$로 표시합니다.
중심극한정리에 의하여 확률변수 $\bar X$는 평균을 $\sigma_X$로 하는 정규분포를 나타냅니다. 그리고 표본평균($\bar X$)의 표집분포의 표준편차는 다음식과 같습니다.
$\dfrac{\sigma_X}{\sqrt{n}}$
다음과 같이 $(\bar X – \mu_X)$를 오차(Error)라 한다면 $\dfrac{\sigma_X}{\sqrt{n}}$는 오차$(\bar X – \mu_X)$의 표준오차(Standard Error)입니다.
${\rm SE} (\bar X – \mu_X)=\dfrac{\sigma_X}{\sqrt{n}}$
표준오차인 ${\rm SE} (\bar X – \mu_X)$는 확률변수 $\bar X$가 나타내는 확률분포(표집분포)의 표준편차와 같습니다. 즉, $\bar X$의 확률분포가 $\sigma_X$를 중심으로 하는 종모양(정규분포)을 나타낸다는 것이고 그 분포값은 $\dfrac{\sigma_X}{\sqrt{n}}$가 됩니다.
확률변수$\bar X$를 다음과 같이 표준화 하면 표준정규분포를 이루는 확률변수 $Z$가 됩니다. 또 모르는 모표준편차값 $\sigma_X$를 표본의 확률변수인 표본표준편차($S_X$)로 대치하면 확률변수 $t$가 됩니다. 이 떄 확률변수 $t$는 모수인 자유도에 따른 확률분포를 가집니다. 여기서 자유도는 표본의 크기에서 1을 뺀 값입니다. 반면, 확률변수 $Z$는 평균이 1이고 분산이 1인 표준정규분포를 나타냅니다.
$\dfrac{(\bar X – \mu_X)}{\dfrac{\sigma_X}{\sqrt{n}}}→Z$
$\dfrac{(\bar X – \mu_X)}{\dfrac{S_X}{\sqrt{n}}}→t$
여기서, 확률변수 $t$는 표본크기($n$)에 따라 다른 확률분포를 가지는 $t$분포를 나타냄
3. 실습
3.2. 구글시트 함수
=COUNT(B3:B22) : 숫자 형식의 데이터 개수. B3에서 B22 범위의 데이터 개수를 구함.
=AVERAGE(B3:B22) : 평균. B3에서 B22 범위에 있는 데이터의 산술평균을 계산함.
=STDEV.S(B3:B22) : 표본표준편차. B3에서 B22 범위에 있는 데이터의 표본표준편차를 계산함. STDEV.S 대신 STDEV.P를 입력하면, 모표준편차를 계산함.
=(B3-B24)/(B25/SQRT(B23)) : t변환 값 계산. B3 값의 t 변환값을 계산. B24에서 표본평균, B25에는 표본표준편차, B23에는 표본의 크기 값이 있음. SQRT는 제곱근을 계산함.
=T.DIST(C3,B23-1,FALSE) : B23-1의 자유도를 가진 t분포에서 C3 확률변수의 확률밀도. FALSE 자리에 TRUE를 입력하면 누적확률밀도를 계산함.
3.3. 실습강의
당도 평균이 15인 딸기 집단에서 20개를 샘플링
표본평균과 표본표준편차
t변환
4. 용어와 수식
4.1 용어