표본통계량 Sample statistic








통계량









표본통계량



구매한 딸기 포장지에 적혀 있는 당도가 맞는가를 확인하고 싶습니다. 그래서  포장지 속에 들어있는 딸기 20개의 당도를 한번 측정해 보았습니다. 그 결과, 20개의 숫자로 구성된 1개의 숫자무리가 생겼습니다. 

이 숫자무리를 우리는 보통 표본이라고 부릅니다. 여기서 표본의 크기는 20입니다. 표본의 개수는 1개입니다. 

 

표본을 대표하는 숫자를 찾는 것을 표본통계량을 구한다고 합니다. 대표적인 표본통계량으로는 대표값과 분포값(산포도, 散布度,  dispersion)이 있습니다. 대표값은 평균(mean), 중앙값(median), 최빈값(mode)등이 있습니다. 분포의 정도를 나타내는 분포값에는 분산(variance)과 분산의 제곱근인 표준편차(Standard deviation)등이 있습니다.

 

위의 애니메이션에서 표본의 분산을 계산할 때 표본의 크기에서 1을 뺀 19를 사용하는 것을 볼 수 있습니다. 이것은 표본의 분산을 구할 때 전체 변동량을 표본의 자유도로 나누어 주는데 여기서 표본의 자유도는 표본의 크기에서 기준으로 사용되는 표본평균의 개수인 1을 뺴줍니다. 

 

한편, 포장지에 적혀있는 당도를 모집단의 당도라고 생각해 봅니다.

그리고 측정한 표본 데이터에서 구한 당도 평균과 포장지의 당도를 비교해 봅니다. 포장지에 표시된 당도보다 구매한 당도 표본의 평균이 더 크면 좋겠습니다. 여기서 차이가 표준오차입니다.

 

딸기의 모집단은 무엇일까요.

재배농가의 그 해에 재배한 딸기를 의미할까요. 아니면 딸기품종을 의미할까요.

 

우리는 딸기를 먹을 때도 참 많은 생각을 해야하는 4차산업혁명시대에 살고 있습니다.




표본통계량

표본크기(n) :


최대값 :

1사분위수:

중앙값 :

3사분위수 :

최소값 :


표본평균 $\bar{X}$ :

표본분산 $s^2$ :

표본표준편차 $S$ :

표본집단 간의 상관계수 $r$ :

표본집단 간의 회귀계수

기울기 $\hat{\beta_1}$ …$\hat{\beta_n}$ :

절편 $\hat{\beta_0}$ :


왜도(skewness) :

첨도(kurtosis) :


표본평균의 95% 신뢰구간 :

표본중앙값의 95% 신뢰구간 :

표본표준편차의 95% 신뢰구간 :



통계량

모집단크기(N) :


최대값 :

1사분위수 :

중앙값 :

3사분위수 :

최소값 :


모평균 $\mu$ :

모분산 $\sigma^2$ :

모표준편차 $\sigma$ :

모집단 간의 상관계수 $\rho$

모집단 간의 회귀계수

기울기 $\beta_1$ …$\beta_n$ :

절편 $\beta_0$ :


왜도(skewness) :

첨도(kurtosis) :


모평균의 95% 신뢰구간 :

모중앙값의 95% 신뢰구간 :

모표준편차의 95% 신뢰구간 :



평균(mean)

${평}{균}{=}\frac{{x}_{1}{+}{x}_{2}{+}\cdots{+}{x}_{n}}{n}{=}\frac{1}{n}\mathop{\sum}\limits_{{i}{=}{1}}\limits^{n}{{x}_{i}}$ ${x}_{1}{,}{x}_{2}{,}\ldots{,}{x}_{n}$ ($n$개의 데이터 값)


분산(variance)

${\rm 모분산}\ \ {\rm \sigma}^{{\rm 2}}={{\sum\limits_{i=1}^{N}{(x_{i}-{\rm \mu})^{2}}}\over{N}}$          ($N$: 모집단의 크기)

${\rm 표본분산}\ \ s^{2}={{\sum\limits_{i=1}^{n}{{\left({x_{i}-\bar x}\right)}^{2}}}\over{n-1}}$          ($n$: 표본의 크기)


 



표준편차(standard deviation)

${\rm 모표준편차}\ \ {\rm \sigma}=\sqrt{{\rm \sigma}^{2}}$ ${\rm 표본표준편차}\ \ s=\sqrt{s^{2}}$ 분산의 제곱근
 

변동계수(coefficient of variation, 변이계수)

  변동계수(모집단)   $CV={{\sigma}\over{\mu}}\times 100$     (단위 %)   변동계수(표본)   $CV={{s}\over{x}}\times 100$     (단위 %)
 


강의와 실습

아래의 구글시트 실습하기를 눌러서, 본인의 구글 계정으로 구글시트를 복사하신 후, 실습하실 수 있습니다. 실습 과정은 AI 강의로 보실 수 있습니다.





구글시트 실습하기

구글시트는 별도의 설치 과정없이 크롬(Chrome)에서 바로 사용하실 수 있습니다.