도수분포표 Frequency table



도수분포표


변수의 각 구간에 속하는 요소(element, object, record)의 개수를 합한 것을 빈도수(도수, frequency)라 하는데 줄여서 도수라고 합니다. 각 구간별로 빈도수를 나타낸 표가 바로 도수분포표입니다.

도수분포표(frequency table)를 작성하는 것은 연속형 데이터를 정리하는 효과적인 방법입니다.

 

연속형 데이터의 도수분포도를 그려서 데이터를 분석하고자 합니다. 도수분포도를 그리기에 앞서서 우선  도수분포표를 작성합니다.

 

도수분포표 작성을 위해서는 변수의 범위(range)를 정해야 하는데  변수의 최대값과 최소값의 차로 변수의 범위를 구합니다. 그리고 동일한 간격을 가진 서로 중복되지 않는 구간(계급, bin, bucket)을  정합니다. 위의 애니메이션에서는 딸기 20개의 당도 데이터가 변수입니다.

 

‘몇 개의 구간으로 정할 것인가?’는 데이터를 분석하기 위해서 정하는 가장 중요한 결정 중의 하나입니다.  구간의 개수는 보통 데이터의 수의 제곱근에 근사한 정수로 합니다. 

구간의 개수가 정해지면 변수의 범위(최대값-최소값)를 구간의 개수로 나누어 구간을 구합니다.

각 구간의 시작점과 끝점은 보통  ‘~ 이상($≥$)에서 ~ 미만($<$)’으로 정합니다.


구글시트 실습

아래의 구글시트 실습하기를 눌러서, 본인의 구글 계정으로 구글시트를 복사하신 후, 실습하실 수 있습니다. 실습 과정은 AI 강의로 보실 수 있습니다.



구글시트 실습하기

구글시트는 별도의 설치 과정없이 크롬(Chrome)에서 바로 사용하실 수 있습니다.