t변환
t transformation

1. 애니메이션

1.1. 자유도를 1에서 50까지 변화시키면서 t분포 관찰


2. 설명

2.1. t변환


3. 실습

3.1. 구글시트

3.2. 구글시트 함수

3.3. 실습강의


4. 용어와 수식

4.1. 용어


1. 애니메이션



자유도를 1에서 50까지 변화시키면서 t분포 관찰


2. 설명

2.1 t변환

확률변수 $X$를 가지는 집단에서 추출한 크기 $n$인 표본의 표본평균도 확률변수가 되며  $\bar X$로 표시합니다. 표본의 표본표준편차는 $S_X$로 표시합니다. 집단의 모평균은 $\mu_X$, 모표준편차는 $\sigma_X$로 표시합니다.

중심극한정리에 의하여 확률변수 $\bar X$는 평균을 $\sigma_X$로 하는 정규분포를 나타냅니다. 그리고 표본평균($\bar X$)의 표집분포의 표준편차는 다음식과 같습니다.

$\dfrac{\sigma_X}{\sqrt{n}}$

다음과 같이 $(\bar X – \mu_X)$를 오차(Error)라 한다면 $\dfrac{\sigma_X}{\sqrt{n}}$는 오차$(\bar X – \mu_X)$의 표준오차(Standard Error)입니다.

${\rm SE} (\bar X – \mu_X)=\dfrac{\sigma_X}{\sqrt{n}}$

표준오차인 ${\rm SE} (\bar X – \mu_X)$는 확률변수 $\bar X$가 나타내는 확률분포(표집분포)의 표준편차와 같습니다. 즉,  $\bar X$의 확률분포가 $\sigma_X$를 중심으로 하는 종모양(정규분포)을 나타낸다는 것이고 그 분포값은 $\dfrac{\sigma_X}{\sqrt{n}}$가 됩니다.

확률변수$\bar X$를 다음과 같이 표준화 하면 표준정규분포를 이루는 확률변수 $Z$가 됩니다. 또 모르는 모표준편차값  $\sigma_X$를 표본의 확률변수인 표본표준편차($S_X$)로 대치하면 확률변수 $t$가 됩니다.  이 떄 확률변수 $t$는 모수인 자유도에 따른 확률분포를 가집니다. 여기서 자유도는 표본의 크기에서 1을 뺀 값입니다. 반면, 확률변수 $Z$는 평균이 1이고 분산이 1인 표준정규분포를 나타냅니다.

$\dfrac{(\bar X – \mu_X)}{\dfrac{\sigma_X}{\sqrt{n}}}→Z$

$\dfrac{(\bar X – \mu_X)}{\dfrac{S_X}{\sqrt{n}}}→t$

여기서,  확률변수 $t$는 표본크기($n$)에 따라 다른 확률분포를 가지는 $t$분포를 나타냄


3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


t변환

3.2. 구글시트 함수

=COUNT(B3:B22) : 숫자 형식의 데이터 개수. B3에서 B22 범위의 데이터 개수를 구함.

=AVERAGE(B3:B22) : 평균. B3에서 B22 범위에 있는 데이터의 산술평균을 계산함.

=STDEV.S(B3:B22) : 표본표준편차. B3에서 B22 범위에 있는 데이터의 표본표준편차를 계산함. STDEV.S 대신 STDEV.P를 입력하면, 모표준편차를 계산함.

=(B3-B24)/(B25/SQRT(B23)) : t변환 값 계산. B3 값의 t 변환값을 계산. B24에서 표본평균, B25에는 표본표준편차, B23에는 표본의 크기 값이 있음. SQRT는 제곱근을 계산함.

=T.DIST(C3,B23-1,FALSE) : B23-1의 자유도를 가진 t분포에서 C3 확률변수의 확률밀도. FALSE 자리에 TRUE를 입력하면 누적확률밀도를 계산함.


3.3. 실습강의

당도 평균이 15인 딸기 집단에서 20개를 샘플링

표본평균과 표본표준편차

t변환



4. 용어와 수식

4.1 용어