t변환 t transformation



자유도를 1에서 50까지 변화시키면서 t분포 관찰

확률변수 $X$를 가지는 집단에서 추출한 크기 $n$인 표본의 표본평균도 확률변수가 되며  $\bar X$로 표시합니다. 표본의 표본표준편차는 $S_X$로 표시합니다. 집단의 모평균은 $\mu_X$, 모표준편차는 $\sigma_X$로 표시합니다.

중심극한정리에 의하여 확률변수 $\bar X$는 평균을 $\sigma_X$로 하는 정규분포를 나타냅니다. 그리고 표본평균($\bar X$)의 표집분포의 표준편차는 다음식과 같습니다.

$\dfrac{\sigma_X}{\sqrt{n}}$

다음과 같이 $(\bar X – \mu_X)$를 오차(Error)라 한다면 $\dfrac{\sigma_X}{\sqrt{n}}$는 오차$(\bar X – \mu_X)$의 표준오차(Standard Error)입니다.

${\rm SE} (\bar X – \mu_X)=\dfrac{\sigma_X}{\sqrt{n}}$

표준오차인 ${\rm SE} (\bar X – \mu_X)$는 확률변수 $\bar X$가 나타내는 확률분포(표집분포)의 표준편차와 같습니다. 즉,  $\bar X$의 확률분포가 $\sigma_X$를 중심으로 하는 종모양(정규분포)을 나타낸다는 것이고 그 분포값은 $\dfrac{\sigma_X}{\sqrt{n}}$가 됩니다.

확률변수$\bar X$를 다음과 같이 표준화 하면 표준정규분포를 이루는 확률변수 $Z$가 됩니다. 또 모르는 모표준편차값  $\sigma_X$를 표본의 확률변수인 표본표준편차($S_X$)로 대치하면 확률변수 $t$가 됩니다.  이 떄 확률변수 $t$는 모수인 자유도에 따른 확률분포를 가집니다. 여기서 자유도는 표본의 크기에서 1을 뺀 값입니다. 반면, 확률변수 $Z$는 평균이 1이고 분산이 1인 표준정규분포를 나타냅니다.

$\dfrac{(\bar X – \mu_X)}{\dfrac{\sigma_X}{\sqrt{n}}}→Z$

$\dfrac{(\bar X – \mu_X)}{\dfrac{S_X}{\sqrt{n}}}→t$

여기서,  확률변수 $t$는 표본크기($n$)에 따라 다른 확률분포를 가지는 $t$분포를 나타냄

실습

아래의 구글시트 실습을 누르시면, 본인의 데이터링크 계정으로 구글시트를 복사하신 후, 실습하실 수 있습니다. 실습에 대한 설명은 AI 강의로 보실 수 있습니다.

구글시트 사용법 크롬 설치

t변환
구글시트 실습

<구글시트 함수>

=COUNT(B3:B22) : 숫자 형식의 데이터 개수. B3에서 B22 범위의 데이터 개수를 구함.

=AVERAGE(B3:B22) : 평균. B3에서 B22 범위에 있는 데이터의 산술평균을 계산함.

=STDEV.S(B3:B22) : 표본표준편차. B3에서 B22 범위에 있는 데이터의 표본표준편차를 계산함. STDEV.S 대신 STDEV.P를 입력하면, 모표준편차를 계산함.

=(B3-B24)/(B25/SQRT(B23)) : t변환 값 계산. B3 값의 t 변환값을 계산. B24에서 표본평균, B25에는 표본표준편차, B23에는 표본의 크기 값이 있음. SQRT는 제곱근을 계산함.

=T.DIST(C3,B23-1,FALSE) : B23-1의 자유도를 가진 t분포에서 C3 확률변수의 확률밀도. FALSE 자리에 TRUE를 입력하면 누적확률밀도를 계산함.



<실습강의 내용>

당도 평균이 15인 딸기 집단에서 20개를 샘플링

표본평균과 표본표준편차

t변환