모수 Parameter



당도 통계량


통계량을 의미하는 Statistic의 복수형인 Statistics는 통계를 의미합니다. 통계량이 모이면 통계가 된다는 뜻입니다.

 

통계량에는 평균이 있습니다.  20개의 딸기의 당도 데이터가 있습니다. 즉, 20개의 숫자입니다.  20개의 숫자 무리를 대표하는 것에는 평균이 있습니다. 당도의 평균은 11.89라는 값입니다. 20개의 당도를 대표하는 값입니다.

 

그리고 평균으로 부터 20개의 값들이 서로 얼마나 떨어져 있는지도 숫자무리의 속성을 나타냅니다. 이것을 분산이라고 합니다. 애니메이션에서는 0.1245라는 값으로 나타납니다. 분산의 값이 커지면 20개의 당도 값은 서로 많이 떨어져 있다는 뜻입니다. 

 

평균을 기준으로 평균과의 차이를 편차라고 합니다. 분산은 각 편차제곱의 평균입니다. 즉, 평균으로부터 떨어진 거리의 제곱들의의 평균입니다. 그리고 당도값과 같은 단위로 나타내기 위하여 분산을 다시 제곱근을 하여  표준화한 편차 즉, 표준편차도 있습니다.

 

통계량은 다음과 같이 정리할 수 있습니다.

 

  • 첫째는 20개의 당도가 있고 그 당도들은 하나의 대표값으로 표현할 수 있습니다. 평균입니다.
  • 둘째는 20개의 평균으로 부터 떨어진 거리가 있고 그 거리들은 하나의 대표값으로 표현할 수 있습니다. 표준편차입니다.
  • 세째는 숫자무리를 표현하는 통계량에는 평균, 분산, 표준편차가 있습니다.

유한집단의 모수 계산

사례수

 

$N$

 

관찰값

 

${X_1}, { X_2}, … , {X_N}$

 

모평균

 

$\mu_X=\dfrac{\sum\limits_{i=1}^{N}X_i}{N}$

 

모분산

 

$\sigma_X^2=\dfrac{\sum\limits_{i=1}^{N}(X_i-\mu_X)^2}{N}$

 

모표준편차

 

$\sigma_X=\sqrt{\sigma_X^2}=\sqrt{\dfrac{\sum\limits_{i=1}^{N}(X_i-\mu_X)^2}{N}}$

 

집단과 표본 그리고 표집분포(표본분포, Sampling distribution)

표집분포는 집단에서 일정한 크기로 뽑을 수 있는 모든 표본을 뽑았을 때, 그 모든 표본의 특성치, 즉 통계량의 확률분포입니다. 표본평균의 표집분포, 표본분산의 표집분포, 표본비율의 표집분포가 있습니다.

 



평균(mean)

${평}{균}{=}\frac{{x}_{1}{+}{x}_{2}{+}\cdots{+}{x}_{n}}{n}{=}\frac{1}{n}\mathop{\sum}\limits_{{i}{=}{1}}\limits^{n}{{x}_{i}}$ ${x}_{1}{,}{x}_{2}{,}\ldots{,}{x}_{n}$ ($n$개의 데이터 값)

분산(variance)

${\rm 모분산}\ \ {\rm \sigma}^{{\rm 2}}={{\sum\limits_{i=1}^{N}{(x_{i}-{\rm \mu})^{2}}}\over{N}}$          ($N$: 모집단의 크기)

${\rm 표본분산}\ \ s^{2}={{\sum\limits_{i=1}^{n}{{\left({x_{i}-\bar x}\right)}^{2}}}\over{n-1}}$          ($n$: 표본의 크기)


 


표준편차(standard deviation)

${\rm 모표준편차}\ \ {\rm \sigma}=\sqrt{{\rm \sigma}^{2}}$ ${\rm 표본표준편차}\ \ s=\sqrt{s^{2}}$ 분산의 제곱근
 

변동계수(coefficient of variation, 변이계수)

  변동계수(모집단)   $CV={{\sigma}\over{\mu}}\times 100$     (단위 %)   변동계수(표본)   $CV={{s}\over{x}}\times 100$     (단위 %)
 

실습

아래의 구글시트 실습을 누르시면, 본인의 데이터링크 계정으로 구글시트를 복사하신 후, 실습하실 수 있습니다. 실습에 대한 설명은 AI 강의로 보실 수 있습니다.

구글시트 사용법 크롬 설치


<구글시트 함수>

=FACT(A3) : 숫자의 계승. A3에 있는 숫자의 계승을 계산함. 예를 들어, A3에 있는 숫자가 2이면, 2×1(2곱하기 1)의 값을 계산해서 표시함. A3에 있는 숫자가 3이면, 3×2×1(3곱하기2곱하기 1)의 값을 계산해서 표시함.

=POWER(C3,B3) : 거듭제곱. C3의 값을 B3의 값만큼 거듭제곱한 값을 계산해서 표시함.

=COUNTIF(J3:J10,L3) : 범위에서 조건에 맞는 개수. J3에서 J10에서 L3의 값을 가진 데이터의 개수를 표시함. \$표시를 알파벳 앞뒤로 넣으면, 셀을 복사해도 그 값이 바뀌지 않음.

=AVERAGE(R3:S3) : 평균. R3에서 S3에 있는 데이터의 평균을 계산해서 표시함.

=SUM(W3:W7) : 합계. W3에서 W7에 있는 데이터의 합계를 계산해서 표시함.

 



<실습강의 내용>

이항분포

이항분포에서 실현된 집단

집단의 부분집합

모수(parameter)