비모수검정
1.1. 애니메이션 제목
1. 애니메이션
2. 설명
2.1. 비모수검정(Non-Parametic Test)
모집단이 정규분포일 때 모수검정(parametric test)
모집단의 확률분포는 일반적으로 평균이 $\mu$ 이고 분산이 $\sigma^2$인 정규분포를 따릅니다. 그리고 표본의 개체들은 모집단의 분포와 동일한 확률분포를 따르므로 표본의 개체도 정규분포를 따릅니다.
$$X_1,X_2,\cdots,X_n \sim {\rm iid} \, N(\mu, \sigma^2)$$
모집단의 분포가 정규분포를 따르면 새로운 확률변수인 표본평균($\bar{X}$)은 평균이 $\mu$이고 분산이 $\dfrac{\sigma^2}{n}$인 정규분포를 따르고 $Z$변환한 확률변수는 표준정규분포를 따릅니다.
$$Z=\dfrac{\bar{X}-\mu}{\dfrac{\sigma}{\sqrt{n}}} \sim {\rm iid} \, N(0, 1)$$
여기서, $n$은 표본크기
표본분산($S^2$)에 $\dfrac{(n-1)}{\sigma^2}$을 곱한 또 다른 새로운 확률변수, $\chi^2$은 표본크기가 $n$인 표본에서는 자유도가 $(n-1)$인 카이제곱분포를 따릅니다.
$$\dfrac{(n-1)S^2}{\sigma^2} \sim \chi_{n-1}^2$$
표본평균($\bar{X}$)을 $Z$변환한 새로운 확률변수($Z$) 식에서 모표준편차($\sigma$)를 알지 못하여 모표준편차를 표본표준편차($S$)로 대치하면 또 다른 새로운 확률변수, $T$가 됩니다. $T$는 자유도 $(n-1)$인 t분포를 따릅니다.
$$\dfrac{\bar{X}-\mu}{\dfrac{\sigma}{\sqrt{n}}} \sim {\rm iid} \, t_{n-1}$$
두 확률변수, $V \sim \chi_{(k)}^2$와 $U \sim \chi_{(m)}^2$가 서로 독립이면 새로운 확률변수, $F$는 자유도가 $k$와 $m$인 F분포를 따릅니다.
$$F=\dfrac{\dfrac{V}{k}}{\dfrac{U}{m}} \sim \chi_{m, k}^2$$
중요한 점은 이상의 모수추정과 모수의 가설검정에서 사용할 새로운 확률변수들은 모두, 정규분포를 따르는 모집단으로부터 추출된 표본통계량 표집의 확률분포입니다.
비모수검정이 필요한 경우
– 모집단의 분포가 정규분포가 아닌 경우 : 이항분포에서의 확률 $p$가 $\dfrac{1}{2}$이 아니어서 왜도가 발생한 경우
– 순서척도 또는 명목척도로 관측한 데이터 : 이산형 독립변수(설명변수)의 간격을 모르고 순서만 아는 경우
– 데이터의 수가 작은 경우 : 두 표본크기 $n_1$과 $n_2$가 작은 경우
비모수검정의 단점
비모수검정은 모수검정보다 검정력이 낮습니다. 따라서, 비모수검정에서는 귀무가설을 기각하는 확률, $\alpha$의 값을 모수검정보다 크게 해야 합니다. 반대로 귀무가설을 채택하는 확률인 $(1-\alpha)$의 값을 비모수검정에서는 모수검정보다 작게 해야 합니다. 다르게 표현하면, 비모수검정에서는 귀무가설을 기각하지 않는 확률, $\beta$의 값을 모수검정보다 작게 해야 합니다. 반대로 귀무가설을 기각하는 확률인 $(1-\beta)$의 값을 비모수검정에서는 모수검정보다 크게 해야 합니다.
모평균에 대한 비모수검정
1) 1표본인 경우 : 1표본은 전체 모집단에서 추출하거나 설계한 표본이 모집단의 범주(category, 수준, level)가 없어 1개인 경우를 말함니다.
♦ Sign test
♦ Wilcoxon signed ranks (대응표본 t검정의 비모수검정, the non-parametric version of matched samples t-test)
2) 2표본인 경우 : 2표본은 전체 모집단에서 추출하거나 설계한 표본이 모집단의 범주가 2개여서 2개의 표본이 생성된 경우를 말합니다.
♦ Mann Whitney U test (독립표본 t검정의 비모수검정, the Wilcoxon rank sum test)
♦ the Mann Whitney Wilcoxon test (범주가 2개인 F검정의 비모수검정)
3) 여러 표본인 경우 : 여러 표본은 전체 모집단에서 추출하거나 설계한 표본이 모집단의 범주가 2개 이상이어서 2개 이상의 표본이 생성된 경우를 말합니다.
♦ Kruskal Wallis test (범주가 여러 개인 F검정의 비모수검정)
Sign Test(부호검정)
부호검정은 분포의 중앙값에 대하여 검정하는 기법입니다. 부호검정의 귀무가설은 다음과 같습니다.
귀무가설($H_0$) : 모평균=중앙값
표본데이터 값이 중앙값보다 크면 +부호를 작으면 – 부호를 부여합니다. +의 개수와 –의 개수가 비슷하면 귀무가설을 기각하지 못하고 차이가 나면 귀무가설을 기각합니다. + 값이 나오는 개수를 $X$ 라 하면 확률변수 $X$ 는 이항분포를 따릅니다.
$$X \sim Bin(n,p)$$
귀무가설이 채택되면
$$p=\dfrac{1}{2}$$
따라서 $X=x$ 라면 이항분포의 확률을 구하고, 유의수준과 비교하여 판정합니다.
Mann Whitney U test (독립표본 t검정의 비모수검정, the Wilcoxon rank sum test)
두 표본크기 $n_1$과 $n_2$가 작을 때 적용합니다. 여기서, $n_1$은작은 집단의 크기,$n_2$는큰 집단의 크기입니다. 검정순서는 다음과 같습니다.
Step 1 : 순서대로 나열하고 순서 매기기
Step 2 : 표본의 크기가 다른 경우, 크기가 작은 집단의 순위 합계($T$) 구하기
Step 3 : Wilcoxson rank sum test 를 위한 하한 경계치 $T_{\alpha}$값 찾기
Step 4 : 상한치 구하기 $n_1(n_1+n_2+1)−T_{\alpha}$
Step 5 : 판정
Mann Whitney Wilcoxon test (범주가 2개인 F검정의 비모수검정)
Step 1 : 순서대로 나열하고 순서 매기기(Wilcoxon rank sum test 와 동일)
Step 2 : $\chi^2$값을 구해서 자유도가 1인 카이제곱 분포의 기준과 비교하고 판정
Kruskal-Wallis test (범주가 여러개인 F검정의 비모수검정)
Kruskal-Wallis test는 표본이 2개 이상이고 표본의 모집단이 정규분포를 따른다는 가정을 할 수 없는 경우, 표본이 2개 이상인 경우의 모수검정인 일원분산분석 대신 적용합니다. Kruskal-Wallis test를 할 때, 서로 다른 모집단에서 추출한 표본이 독립적이고 동일한 연속형 확률분포이지만 정규분포를 따르지 않는다고 가정합니다.
가정 : 서로 다른 모집단에서 추출한 표본이 독립적이고 동일한 연속형 확률분포이지만 정규분포를 따르지 않는다
귀무가설($H_0$) : 모든 모집단의 중앙값이 동일함
대립가설($H_1$) : 최소한 하나의 중앙값이 다름
2.2. 설명강의
– 준비 중

3. 실습
3.2. 함수
=ROWS(F2:F2) : 지정된 배열 또는 범위에 있는 행의 개수.
3.3. 실습강의
– 실습강의 목차
