1. 애니메이션

1.1. 애니메이션 제목


2. 설명

2.1. 비모수검정

2.2. 설명강의


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 용어

4.1. 용어

4.2. 참조

1. 애니메이션



애니메이션 제목

2. 설명

2.1. 비모수검정(Non-Parametic Test)

모집단이 정규분포일 때 모수검정(parametric test)

모집단의 확률분포는 일반적으로 평균이 $\mu$ 이고 분산이 $\sigma^2$인 정규분포를 따릅니다. 그리고 표본의 개체들은 모집단의 분포와 동일한 확률분포를 따르므로 표본의 개체도 정규분포를 따릅니다.

$$X_1,X_2,\cdots,X_n \sim {\rm iid} \, N(\mu, \sigma^2)$$

모집단의 분포가 정규분포를 따르면 새로운 확률변수인 표본평균($\bar{X}$)은 평균이 $\mu$이고 분산이 $\dfrac{\sigma^2}{n}$인 정규분포를 따르고 $Z$변환한 확률변수는 표준정규분포를 따릅니다.

$$Z=\dfrac{\bar{X}-\mu}{\dfrac{\sigma}{\sqrt{n}}} \sim {\rm iid} \, N(0, 1)$$

여기서, $n$은 표본크기

표본분산($S^2$)에 $\dfrac{(n-1)}{\sigma^2}$을 곱한 또 다른 새로운 확률변수, $\chi^2$은 표본크기가 $n$인 표본에서는 자유도가 $(n-1)$인 카이제곱분포를 따릅니다.

$$\dfrac{(n-1)S^2}{\sigma^2} \sim \chi_{n-1}^2$$

표본평균($\bar{X}$)을 $Z$변환한 새로운 확률변수($Z$) 식에서 모표준편차($\sigma$)를 알지 못하여 모표준편차를 표본표준편차($S$)로 대치하면 또 다른 새로운 확률변수, $T$가 됩니다. $T$는 자유도 $(n-1)$인 t분포를 따릅니다.

$$\dfrac{\bar{X}-\mu}{\dfrac{\sigma}{\sqrt{n}}} \sim {\rm iid} \, t_{n-1}$$

두 확률변수, $V \sim \chi_{(k)}^2$와 $U \sim \chi_{(m)}^2$가 서로 독립이면 새로운 확률변수, $F$는 자유도가 $k$와 $m$인 F분포를 따릅니다.

$$F=\dfrac{\dfrac{V}{k}}{\dfrac{U}{m}} \sim \chi_{m, k}^2$$

중요한 점은 이상의 모수추정과 모수의 가설검정에서 사용할 새로운 확률변수들은 모두, 정규분포를 따르는 모집단으로부터 추출된 표본통계량 표집의 확률분포입니다.

비모수검정이 필요한 경우

– 모집단의 분포가 정규분포가 아닌 경우 : 이항분포에서의 확률 $p$가 $\dfrac{1}{2}$이 아니어서 왜도가 발생한 경우

– 순서척도 또는 명목척도로 관측한 데이터 : 이산형 독립변수(설명변수)의 간격을 모르고 순서만 아는 경우

– 데이터의 수가 작은 경우 : 두 표본크기 $n_1$과 $n_2$가 작은 경우

비모수검정의 단점

비모수검정은 모수검정보다 검정력이 낮습니다. 따라서, 비모수검정에서는 귀무가설을 기각하는  확률, $\alpha$의 값을 모수검정보다 크게 해야 합니다. 반대로 귀무가설을 채택하는 확률인  $(1-\alpha)$의 값을 비모수검정에서는 모수검정보다 작게 해야 합니다.  다르게 표현하면, 비모수검정에서는 귀무가설을 기각하지 않는 확률, $\beta$의 값을 모수검정보다 작게 해야 합니다. 반대로 귀무가설을 기각하는 확률인  $(1-\beta)$의 값을 비모수검정에서는 모수검정보다 크게 해야 합니다.

모평균에 대한 비모수검정

1) 1표본인 경우 : 1표본은  전체 모집단에서 추출하거나 설계한 표본이 모집단의 범주(category, 수준, level)가 없어 1개인 경우를 말함니다.

♦ Sign test

♦ Wilcoxon signed ranks (대응표본 t검정의 비모수검정, the non-parametric version of  matched samples t-test)

2) 2표본인 경우 : 2표본은 전체 모집단에서 추출하거나 설계한 표본이 모집단의 범주가 2개여서 2개의 표본이 생성된 경우를 말합니다.

♦ Mann Whitney U test (독립표본 t검정의 비모수검정,  the Wilcoxon rank sum test)

♦ the Mann Whitney Wilcoxon test (범주가 2개인 F검정의 비모수검정)

3) 여러 표본인 경우 : 여러 표본은 전체 모집단에서 추출하거나 설계한 표본이 모집단의 범주가 2개 이상이어서 2개 이상의 표본이 생성된 경우를 말합니다.

♦ Kruskal Wallis test (범주가 여러 개인 F검정의 비모수검정)

Sign Test(부호검정)

부호검정은 분포의 중앙값에 대하여 검정하는 기법입니다. 부호검정의 귀무가설은 다음과 같습니다.

귀무가설($H_0$) : 모평균=중앙값

표본데이터 값이 중앙값보다 크면 +부호를 작으면 – 부호를 부여합니다. +의 개수와 –의 개수가 비슷하면 귀무가설을 기각하지 못하고 차이가 나면 귀무가설을 기각합니다. + 값이 나오는 개수를 $X$ 라 하면 확률변수 $X$ 는 이항분포를 따릅니다.

$$X \sim Bin(n,p)$$

귀무가설이 채택되면

$$p=\dfrac{1}{2}$$

따라서 $X=x$ 라면 이항분포의 확률을 구하고, 유의수준과 비교하여 판정합니다.

Mann Whitney U test (독립표본 t검정의 비모수검정,  the Wilcoxon rank sum test)

두 표본크기 $n_1$과 $n_2$가 작을 때 적용합니다.  여기서, $n_1$은작은 집단의 크기,$n_2$는큰 집단의 크기입니다. 검정순서는 다음과 같습니다.

 

Step 1 : 순서대로 나열하고 순서 매기기
Step 2 : 표본의 크기가 다른 경우, 크기가 작은 집단의 순위 합계($T$) 구하기
Step 3 : Wilcoxson rank sum test 를 위한 하한 경계치 $T_{\alpha}$값 찾기 
Step 4 : 상한치 구하기 $n_1(n_1+n_2+1)−T_{\alpha}$

Step 5 : 판정

 

Mann Whitney Wilcoxon test (범주가 2개인 F검정의 비모수검정)

 

Step 1 : 순서대로 나열하고 순서 매기기(Wilcoxon rank sum test 와 동일)

Step 2 : $\chi^2$값을 구해서 자유도가 1인 카이제곱 분포의 기준과 비교하고 판정

 

Kruskal-Wallis test (범주가 여러개인 F검정의 비모수검정)

Kruskal-Wallis test는  표본이 2개 이상이고 표본의 모집단이 정규분포를 따른다는 가정을 할 수 없는 경우, 표본이 2개 이상인 경우의 모수검정인 일원분산분석 대신 적용합니다. Kruskal-Wallis test를 할 때, 서로 다른 모집단에서 추출한 표본이 독립적이고 동일한  연속형 확률분포이지만 정규분포를 따르지 않는다고 가정합니다.

가정 : 서로 다른 모집단에서 추출한 표본이 독립적이고 동일한  연속형 확률분포이지만 정규분포를 따르지 않는다

귀무가설($H_0$) : 모든 모집단의 중앙값이 동일함

대립가설($H_1$) : 최소한 하나의 중앙값이 다름


2.2. 설명강의

– 준비 중


3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.



3.2. 함수

=ROWS(F2:F2) : 지정된 배열 또는 범위에 있는 행의 개수.


3.3. 실습강의

– 실습강의 목차


4. 용어

4.1 용어


제목

내용.

 

Reference

Title – Wikipedia


4.2. 참조


Reference

Wikipedia