정규분포 Normal distribution




이항분포

시행의 결과가 성공과 실패 , 두가지가 있는 시행을 $n$번 시행에서 $k$번 성공하는 확률변수를 $k$로 나타냅니다. 시행횟수 $n$과 성공확률 $p$로 표현되는 이항분포를 살펴보면, 이 확률분포는  $k\sim {\rm B}(n, p)$로 표현됩니다. 확률변수, $k$가 가지는 확률, 즉,  $n$번 시행해서 $k$번 성공할 확률은 다음식과 같은 확률 질량 함수로 주어집니다.

 

$Pr\left({{K}{=}{k}}\right){=}{f}\left({k;n,p}\right){=}{n \choose k}{p}^{k}{\left({{1}{-}{p}}\right)}^{{n}{-}{k}}$

 

만약 $X: {\rm B}\left({n,p}\right)$라면, $X$의 기대값은

 

${\rm E}\left({X}\right)=np$

 

이고 분산은

 

${\rm Var}\left({X}\right)=np\left({1-p}\right)$

 

$m={\rm E}\left({X}\right)=\sum\limits_{i=1}^{n}{x_{i}\cdot p_{i}}$

 

$\sigma^{2}={\rm Var}\left({X}\right)=\sum\limits_{i=1}^{n}{{\left({x_{i}-m}\right)}^{2}}\cdot p_{i}$

 

$=\sum\limits_{i=1}^{n}{\left({x_{i}^{2}\cdot p_{i}}\right)}-m^{2}$

 

분산 = 제곱의 평균 – 평균의 제곱

 

 $\rm{Var}\left({X}\right)={\rm E}\left({X^{2}}\right)-E{\left({X}\right)}^{2}$

 

여기서,  ${\rm E}\left({X^{2}}\right)=\sum{\rm{확률변수}^{2}\times \rm{확률}}$

 

이항분포 ~ 정규분포

$X\sim {\rm B}\left({n,p}\right)$에서 $n$이 충분히 클 때 $X\sim{\rm N}\left({np,\sqrt{np\left({1-p}\right)}}\right)$로 근사합니다.

 

$X\sim{\rm N}\left({np,\sqrt{np\left({1-p}\right)}}\right)$

 

$X\sim {\rm N}\left({\mu ,\sigma^{2}}\right)$

 

이항분포 ANIMATION : 0과 1을 근원사건으로 하는 시행을 $n$번하여 그 합을 확률변수로 합니다. $n$이 점점 커지면 ( 동전의 개수, 갈톤의 분기점의 개수) 이항분포가 정규분포가 됩니다. 확률변수를 1에서 100까지의 자연수로 하고 $n$을 1에서 100까지  증가시킵니다. 가로축의 범위는 0~100, 세로축의 범위는 0.5입니다.

 

${\rm B}\left({1\sim100,\ 0.5}\right)$

 

범위를 1로 고정시키고 단위를 1/$n$ 으로 합니다. $n$을 1에서 100까지 변화를 주면서 관찰합니다. 가로축의 범위는 $0~1$, 세로축의 범위는 $0.5$입니다.

 

${\rm B}\left(1\sim\dfrac{1}{100},\ 0.5\right)$

 

정규분포

표준정규분포

 

$y=\dfrac{1}{\sqrt{2\pi}}{\rm exp}^{-\dfrac{1}{2}{x^2}}$

 

평균, $\mu$와 분산, $\sigma^{2}$를 모수로 하는 정규분포를 나타내는 확률변수, $X$의  확률밀도함수 $f(X)$는 다음과 같습니다.

 

$f(X)=\dfrac{1}{\sigma\sqrt{2\pi}}{\rm exp}^{-\dfrac{1}{2}\dfrac{\left({x-\mu}\right)^2}{\sigma^2}},\ -\infty\leq X\leq+\infty$

 

이항분포

확률변수 $k$가 매개변수 $n$과 $p$를 가지는 이항분포를 따른다면, $k\sim B\left({n,p}\right)$라고 쓴다. $n$번 시행중에 $k$번 성공하는 확률변수의 확률질량함수는

 

$Pr\left({{K}{=}{k}}\right){=}{f}\left({k;n,p}\right)$

${=}{n \choose k}{p}^{k}{\left({{1}{-}{p}}\right)}^{{n}{-}{k}}$

 

만약 $X\sim {\rm B}\left({n,p}\right)$라면, $X$의 기대값은

 

${\rm E}\left({X}\right)=np$

 

이고 분산은

 

 $\rm{Var}\left({X}\right)={\rm E}\left({X^{2}}\right)-E{\left({X}\right)}^{2}$

$=np(1-p)$


이항분포 ~ 정규분포

$X\sim {\rm B}\left({n,p}\right)$에서 $n$이 충분히 클 때 $X\sim{\rm N}\left({np,\sqrt{np\left({1-p}\right)}}\right)$로 근사합니다.

 

$X\sim{\rm N}\left({np,\sqrt{np\left({1-p}\right)}}\right)$

 

$X\sim {\rm N}\left({\mu ,\sigma^{2}}\right)$


정규분포

표준정규분포

 

$y=\dfrac{1}{\sqrt{2\pi}}{\rm exp}^{-\dfrac{1}{2}{x^2}}$

 

평균, $\mu$와 분산, $\sigma^{2}$를 모수로 하는 정규분포를 나타내는 확률변수, $X$의  확률밀도함수 $f(X)$는 다음과 같습니다.

 

$f(X)=\dfrac{1}{\sigma\sqrt{2\pi}}{\rm exp}^{-\dfrac{1}{2}\dfrac{\left({x-\mu}\right)^2}{\sigma^2}}$

 

여기서,  $-\infty\leq X\leq+\infty$

 


실습

아래의 구글시트 실습을 누르시면, 본인의 데이터링크 계정으로 구글시트를 복사하신 후, 실습하실 수 있습니다. 실습에 대한 설명은 AI 강의로 보실 수 있습니다.

구글시트 사용법 크롬 설치


<구글시트 함수>

=FACT(A3) : 숫자의 계승. A3에 있는 숫자의 계승을 계산함. 예를 들어, A3에 있는 숫자가 2이면, 2×1(2곱하기 1)의 값을 계산해서 표시함. A3에 있는 숫자가 3이면, 3×2×1(3곱하기2곱하기 1)의 값을 계산해서 표시함.

=POWER(C3,B3) : 거듭제곱. C3의 값을 B3의 값만큼 거듭제곱한 값을 계산해서 표시함.

=SQRT(D3) : 제곱근. D3에 있는 값의 제곱근을 계산해서 표시함.

=NORMDIST(F3,C3,E3,FALSE) : 정규분포 확률밀도. C4가 평균, E3가 표준편차인 정규분포에서 F3가 확률변수일때의 확률밀도를 계산해서 표시함. FALSE를 TRUE로 변경하면 누적확률밀도를 계산해서 표시함.



<실습강의 내용>

동전던지기

동전던지기 결과의 합

이항분포

정규분포