도수분포와 확률분포 Frequency and probability distribution



도수분포와 확률분포




도수분포와 확률분포




도수분포와 정규분포근사


도수와 상대도수

도수분포는 변수의 빈도수를 표현한 것입니다.  변수룰 가로축으로 하고 도수를 세로축으로 하는 도수분포도를 그려서 도수분포를 관찰합니다. 변수가 범주형 변수라면 도수분포도는 막대그래프로 그릴 수 있습니다. 변수가 이산형 변수일 때도 도수분포도는 막대그래프로 그릴 수 있습니다.

 

만일 변수가 범주형이나 이산형 변수이고 확률변수라면 도수를 상대도수로 바꾸면 상대도수는 확률변수의 확률질량이 됩니다.

 

만일 변수가 확률변수이고 연속형 변수이면 변수를 구간으로 나누어 구간의 대표값을 구한 후 그 대표값의 상대도수를 막대그래프로 그리면 막대의 길이가 확률밀도가 됩니다. 만일 히스토그램을 그리면 히스토그램의 경계를 확률밀도값으로 사용할 수도 있습니다. 

 

샹대도수를  히스토그램으로 그린 후 Y축의 스케일을 조정하여 히스토그램이 나타내는 면적을 1로 하면 히스토그램의 경계선이 확률밀도함수를 시각화 한것으로 볼 수 있습니다. 여기서 히스토그램을 근사하여 연속함수로 나타내면 연속형 확률밀도함수를 구할 수 있습니다.


도수와 확률과 통계

통계 : 빈도수의 분포(distribution)를 변수의 관측값으로부터 구합니다.

 

도수분포 히스토그램(변수를 구간화하여 연속형변수를 범주형변수로 만듬)

 

통계를 확률의 세계로(통계적 확률) : 데이터를 확률변수로 데이터의 분포를 확률분포로 표현합니다.

 

큰 수의 법칙

상대도수 히스토그램

 

확률 : 확률분포(Probability distribution)를 확률변수가 독립변수인 함수로 표현합니다.

 

이항분포 (Binomial distribution)

정규분포 (Normal distribution)

카이제곱분포 (Chi-square distribution)

 

확률을 표현하는 함수는 확률질량함수와 확률밀도함수가 있습니다.

 

확률질량함수 : 확률변수가 범주형 확률변수일 때

확률밀도함수 : 확률변수가 연속형 확률변수일 때

 

표본의 관찰값 또는 측정치를 이용하여 모집단의 확률분포를 통계적인 방법으로 추론합니다.

 

점추정

구간추정

가설검정

정규성 검정


실습

아래의 구글시트 실습을 누르시면, 본인의 데이터링크 계정으로 구글시트를 복사하신 후, 실습하실 수 있습니다. 실습에 대한 설명은 AI 강의로 보실 수 있습니다.

구글시트 사용법 크롬 설치


<구글시트 함수>

=COUNT(B3:B22) : 수치형 데이터 개수. B3에서 B22 범위에 있는 수치형 데이터의 개수를 구함.

=MAX(B3:B22) : 최대값. B3에서 B22 범위에서 최대값을 구함.

=MIN(B3:B22) : 최소값. B3에서 B22 범위에서 최소값을 구함.

=ROUNDUP(SQRT(E3),0) : 올림. E3의 제곱근을 구한 후, 소수점 이하 첫번째 자리에서 올림해서 0번째자리까지 값을 구함. =COUNTIFS(B3:B22,”>=11.70″,B3:B22,”<13.06″) : 여러 기준에 맞는 범위의 수. B3에서 B22 범위에서 11.70이상이면서, 13.06 미만인 값의 개수를 구함. 



<실습강의 내용>

데이터

데이터요약

도수분포표

도수분포도

확률분포