정규분포 ?
Normal distribution ?

1. 애니메이션

1.1. 정규분포


2. 설명

2.1. 이항분포

2.2. 이항분포 ~ 정규분포

2.3. 정규분포


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 용어

4.1. 참조

1. 애니메이션







정규분포

2. 설명

2.1. 이항분포

확률변수인 성공횟수($K$)가 시행횟수($N$)와 성공확률($P$)을 매개변수(parameter, 모수)로 가지는 이항분포를 따르면

$$K\sim B\left({n,p}\right)$$

$n$번 시행중에 $k$번 성공할 확률은 다음과 같이 확률질량함수로 주어집니다.

$$Pr\left({{K}{=}{k}}\right){=}{f}\left({k\,;n,p}\right){=}\left({\frac{n}{k}}\right){p}^{k}{\left({{1}{-}{p}}\right)}^{{n}{-}{k}}$$

확률변수 $X$가 이항분포를 따른다고 하면 다음과 같이 표현합니다.

$$X \sim B\left({n,p}\right)$$

$X$의 기대값은 다음과 같습니다.

$$\mathrm{E}\left[{X}\right]=np$$

분산은 다음과 같습니다.

$$\mathrm{Var}\left(X\right)=np\left({1-p}\right)$$

기대값은

$$\mathrm{E}\left[{X}\right]=\sum\limits_{i=1}^{n}{x_{i}\cdot p_{i}}$$

분산은

$${\rm Var}\left({X}\right)=\sum\limits_{i=1}^{n}{{\left({x_{i}-\mathrm{E}[X]}\right)}^{2}}\cdot p_{i}=\sum\limits_{i=1}^{n}{{x_{i}^{2}\cdot p_{i}}}-{\mathrm{E}[X]}^{2}$$

여기서,  $\sum\limits_{i=1}^{n}x_i^2 \cdot p_i={\rm E}[X^2]$

분산등식은

분산 = 제곱의 평균 – 평균의 제곱

분산등식을 수식으로 표현하면

$$\rm{Var}\left({X}\right)=\mathrm{E}\left[{X^{2}}\right]-\mathrm{E}{\left[{X}\right]}^{2}$$


2.2. 이항분포 ~ 정규분포

$X\sim B\left({n,p}\right)$ 에서 $n$이 충분히 클 때 $X\sim N\left({np,\sqrt{np\left({1-p}\right)}}\right)$로 근사합니다.

 

$X\sim N\left({\mu ,\sigma^{2}}\right)$

 

이항분포 ANIMATION : 0과 1의 시행과 확률p를 갖는 시행을 n번하여 그 합을 확률변수로 합니다. 무한번 시행하고 확률을  막대그래프로 표현할 수 있습니다. 이 때 확률변수는양의 정수가 됩니다.

n이 점점 커질때 ( 동전의 개수, 갈톤의 분기점의 개수) -> 이항분포가 정규분포로 근사합니다.

확률변수 단위를 1로하고 범위를 100으로 하여 n을 1에서 100까지  animation, 막대그래프의 범위는 가로축은 0~100, 세로축은 0.5

 

$B\left({1\sim100,\ 0.5}\right)$

 

범위를 1로 고정시키고 단위를 1/n 으로 함. n을 1에서 100까지 animation, 막대그래프의 범위는 가로축은 0~1, 세로축은 0.5

 

$B\left({1\sim{{1}\over{100}},\ 0.5}\right)$


2.3. 정규분포

표준정규분포는 다음과 같습니다.

$y={1\over \sqrt{2\pi}}e^{-{1\over 2}x^2}$

 

평균 $\mu$와 분산 $\sigma^{2}$ 를 모수로 하고 정규분포를 가지는 모집단의  확률밀도함수입니다.

$f\left({X}\right)={{1}\over{\sqrt{2\pi}\sigma}}e^{-{{{\left({x-\mu}\right)}^{2}}\over{2\sigma^{2}}}},\ -\infty\leq X\leq+\infty$


이항분포

확률변수 $k$가 매개변수 $n$과 $p$를 가지는 이항분포를 따른다면, $k\sim B\left({n,p}\right)$라고 쓴다. $n$번 시행중에 $k$번 성공하는 확률변수의 확률질량함수는

 

$Pr\left({{K}{=}{k}}\right){=}{f}\left({k;n,p}\right)$

${=}{n \choose k}{p}^{k}{\left({{1}{-}{p}}\right)}^{{n}{-}{k}}$

 

만약 $X\sim {\rm B}\left({n,p}\right)$라면, $X$의 기대값은

 

${\rm E}\left[{X}\right]=np$

 

이고 분산은

 

 $\rm{Var}\left[{X}\right]={\rm E}\left[{X^{2}}\right]-E{\left[{X}\right]}^{2}$

$=np(1-p)$


이항분포 ~ 정규분포

$X\sim {\rm B}\left({n,p}\right)$에서 $n$이 충분히 클 때 $X\sim{\rm N}\left({np,\sqrt{np\left({1-p}\right)}}\right)$로 근사합니다.

 

$X\sim{\rm N}\left({np,\sqrt{np\left({1-p}\right)}}\right)$

 

$X\sim {\rm N}\left({\mu ,\sigma^{2}}\right)$


정규분포

표준정규분포

 

$y=\dfrac{1}{\sqrt{2\pi}}{\rm exp}^{-\dfrac{1}{2}{x^2}}$

 

평균, $\mu$와 분산, $\sigma^{2}$를 모수로 하는 정규분포를 나타내는 확률변수, $X$의  확률밀도함수 $f(X)$는 다음과 같습니다.

 

$f(X)=\dfrac{1}{\sigma\sqrt{2\pi}}{\rm exp}^{-\dfrac{1}{2}\dfrac{\left({x-\mu}\right)^2}{\sigma^2}}$

 

여기서,  $-\infty\leq X\leq+\infty$

 

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


정규분포 : 구글시트 실습

3.2. 함수

=FACT(A3) : 숫자의 계승. A3에 있는 숫자의 계승을 계산함. 예를 들어, A3에 있는 숫자가 2이면, 2×1(2곱하기 1)의 값을 계산해서 표시함. A3에 있는 숫자가 3이면, 3×2×1(3곱하기2곱하기 1)의 값을 계산해서 표시함.

=POWER(C3,B3) : 거듭제곱. C3의 값을 B3의 값만큼 거듭제곱한 값을 계산해서 표시함.

=SQRT(D3) : 제곱근. D3에 있는 값의 제곱근을 계산해서 표시함.

=NORMDIST(F3,C3,E3,FALSE) : 정규분포 확률밀도. C3가 평균, E3가 표준편차인 정규분포에서 F3가 확률변수일때의 확률밀도를 계산해서 표시함. FALSE를 TRUE로 변경하면 누적확률밀도를 계산해서 표시함.


3.3. 실습강의

– 동전던지기

– 동전던지기 결과의 합

– 이항분포

– 정규분포


4. 용어

4.1. 참조


이항분포 ?
Binomial distribution ?

1. 애니메이션

1.1. 동전의 개수(표본의 크기)와 Galton보드 분기수

1.2. 8개의 분기수를 가지는 Galton보드에서 많은 수의 구슬을 굴렸을 때 보이는 이항분포 시뮬레이션

1.3. 10개의 분기수를 가지는 Galton보드에서 많은 수의 구슬을 굴렸을 때 보이는 이항분포 시뮬레이션

1.4. 32개의 분기수를 가지는 Galton보드에서 많은 수의 구슬을 굴렸을 때 보이는 이항분포 시뮬레이션

1.5. 베르누이 확률변수를 2개에서 100개까지 늘리는 이항분포(p=0.5) 애니메이션

1.6. 이항분포(p=0.5) : 정해진 구간의 갈톤보드에서  분기수를 1에서 100으로 늘려가는 시뮬레이션

1.7. 이항분포(분기수 n=40)에서 p를 p=0.1에서 0.1씩 늘려가면서 p=0.9까지 시뮬레이션


2. 설명

2.1. 이항분포

2.2 이항확률분포(Binomial distribution)


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 용어

4.1. 참조

1. 애니메이션



동전의 개수(표본의 크기)와 Galton보드 분기수




8개의 분기수를 가지는 Galton보드에서 많은 수의 구슬을 굴렸을 때 보이는 이항분포 시뮬레이션




10개의 분기수를 가지는 Galton보드에서 많은 수의 구슬을 굴렸을 때 보이는 이항분포 시뮬레이션




32개의 분기수를 가지는 Galton보드에서 많은 수의 구슬을 굴렸을 때 보이는 이항분포 시뮬레이션




베르누이 확률변수를 2개에서 100개까지 늘리는 이항분포(p=0.5) 애니메이션




이항분포(p=0.5) : 정해진 구간의 갈톤보드에서  분기수를 1에서 100으로 늘려가는 시뮬레이션




이항분포(분기수 n=40)에서 p를 p=0.1에서 0.1씩 늘려가면서 p=0.9까지 시뮬레이션

2. 설명

2.1 이항분포

동전 1개를 던져 앞면이 나오는 수를 확률변수라 하면 확률변수는 0과 1이고  2개입니다.

 

동전을 무한번 던져서 통계학적 확률을 구할 수 있습니다. 이를 큰 수의 법칙이라고 합니다.

완벽한 대칭모양의 동전이라면 동전 1개를 던지는 시행에서 확률변수 0과 1의 확률은 각각 0.5일 것입니다.

 

동전 2개를 던지면 확률변수는 0, 1, 2로  3개이고 각각의 확률은 0.25, 0.5, 0.25 입니다.

 

이런 식으로 던지는 동전의 갯수를 하나씩 늘려 확률변수가 2개일 때부터 101개일 때까지 100단계를 하나씩 올려봅니다.

그리고 확률의 분포, 즉, 이항확률분포를 살펴봅니다.

 

애니메이션에서 보는 것처럼 확률변수의 갯수가 10개 정도까지는 급격하게  확률분포 모양이  변합니다.

하지만 대략 30개가 넘어가면 비슷한 크기의 종모양이 유지되는 모습을  관찰할 수 있습니다.

이 모습은 표본의 크기가 작을 때 t분포를 사용하는 것과 관계가 있습니다.


2.2 이항확률분포(Binomial distribution)

 

$B\left({n,p}\right)$

 

$f\left({k;n,p}\right)=\,_{n}\mathrm{C}_{k}\,p^{k}(1-p)^{(n-k)} ={{n!}\over{(n-k)!\,k!}}\,p^{k}(1-p)^{(n-k)}$

 

$\mathrm{E}\left[{X}\right]=np$

 

$\mathrm{Var}\left[{X}\right]=np\left({1-p}\right)$

 

$\mu = p$

 

$\sigma^{2}={\left({1-p}\right)}^{2}p+{\left({0-p}\right)}^{2}\left({1-p}\right)=p\left({1-p}\right)$

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


이항분포 : 구글시트 실습

3.2. 함수

=FACT(A3) : 숫자의 계승. A3에 있는 숫자의 계승을 계산함. 예를 들어, A3에 있는 숫자가 2이면, 2×1(2곱하기 1)의 값을 계산해서 표시함. A3에 있는 숫자가 3이면, 3×2×1(3곱하기2곱하기 1)의 값을 계산해서 표시함.

=POWER(C3,B3) : 거듭제곱. C3의 값을 B3의 값만큼 거듭제곱한 값을 계산해서 표시함.


3.3. 실습강의

– 동전던지기

– 동전던지기 결과의 합

– 이항분포


4. 용어

4.1. 참조


베르누이 분포 ?
Bernoulli distribution ?

1. 애니메이션

1.1. 시행과 확률


2. 설명

2.1. 베르누이 분포


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 용어

4.1. 참조

1. 애니메이션



시행과 확률

2. 설명

2.1 베르누이 분포

두 면에 0과 1이 적혀 있는 동전이 있습니다. 이 동전 한 개를 바닥에 던져서 윗면의 숫자를 관측하는 것을 시행(try)이라고 한다면 시행의 결과를 알 수 있습니다. 즉, 바닥에 던져진 동전이 0이나 1을 나타내는 것을 시행의 결과라고 합니다. 다르게 표현하면, 시행의 결과가 존재하는 시행공간(Sample Space)에 0과 1이 있다고 할 수 있습니다.

 

0과 1이외의 시행결과는 없고 동전의 모양으로  각 시행결과에 해당하는 확률(Probability)값을 적용할 수 있습니다. 여기서 0과 1이 나올수 있는 정도, 즉 확률은 동전일 경우 반반으로 표현합니다. 총합은 확률의 정의에 의하여 1이 됩니다.

 

동전의 면에 적혀있는 0과 1을 확률변수라고 하고 각각 0.5의 확률을 가지게 됩니다. 또한 시행을 할때 기대하는 확률변수의 값을 기대값이라고 합니다.

한 개의 동전을 바닥에 던지는 시행에서의 기대값은 0도 아니고 1도 아닌 0.5가 됩니다. 동전에 새겨있지 않은 0.5라는 숫자입니다.

물론 가중평균을 구하는 방법에 따라 확률변수 0과 확률 0.5의 곱 그리고 확률변수 1과 확률 0.5의 곱의 합  0.5를  기대값이라 할 수 있습니다.

 

정리하면

시행 : 앞면과 뒷면에 1과 0이 표시된 동전 1개를 바닥에 던져서 나오는 숫자를 관측

시행공간 : {0, 1}

사건 : 0 이 관측됨

사건 : 1 이 관측됨

확률변수 : 0과 1이 새겨진 동전을 던져서 관측되는 값

확률변수값 : 0과 1

확률변수값의 가중 평균 : 0.5

기대값 : 0.5

 

0과 1이 새겨진 동전을 던져 위를 향하는 수를 확률변수라 할때 확률변수의 값과 대응되는 확률을 표로 정리하면 아래표와 같습니다.

 

확률변수값 확률변수값에 대응되는 확률
 1 0.5
0 0.5

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


베르누이 분포 : 구글시트 실습

3.2. 함수

=FACT(A3) : 숫자의 계승. A3에 있는 숫자의 계승을 계산함. 예를 들어, A3에 있는 숫자가 2이면, 2×1(2곱하기 1)의 값을 계산해서 표시함. A3에 있는 숫자가 3이면, 3×2×1(3곱하기2곱하기 1)의 값을 계산해서 표시함. 

=POWER(C3,B3) : 거듭제곱. C3의 값을 B3의 값만큼 거듭제곱한 값을 계산해서 표시함.


3.3. 실습강의

– 동전던지기

– 베르누이 분포


4. 용어

4.1. 참조


이항분포 ?
Binomial distribution ?


확률변수를 2개에서 100개까지 늘리는 이항분포(p=0.5) 애니메이션


동전 1개를 던져 앞면이 나오는 수를 확률변수라 하면 확률변수는 0과 1이고  2개입니다.

 

동전을 무한번 던져서 통계학적 확률을 구할 수 있습니다. 이를 큰 수의 법칙이라고 합니다.

완벽한 대칭모양의 동전이라면 동전 1개를 던지는 시행에서 확률변수 0과 1의 확률은 각각 0.5일 것입니다.

 

동전 2개를 던지면 확률변수는 0, 1, 2로  3개이고 각각의 확률은 0.25, 0.5, 0.25 입니다.

 

이런 식으로 던지는 동전의 갯수를 하나씩 늘려 확률변수가 2개일 때부터 101개일 때까지 100단계를 하나씩 올려봅니다.

그리고 확률의 분포, 즉, 이항확률분포를 살펴봅니다.

 

애니메이션에서 보는 것처럼 확률변수의 갯수가 10개 정도까지는 급격하게  확률분포 모양이  변합니다.

하지만 대략 30개가 넘어가면 비슷한 크기의 종모양이 유지되는 모습을  관찰할 수 있습니다.

이 모습은 표본의 크기가 작을 때 t분포를 사용하는 것과 관계가 있습니다.