교차표
Cross table

1. 애니메이션

1.1. 4 × 4 교차표 : 이산확률분포

1.2. 2 × 2 교차표 : 이항검정


2. 설명

2.1. 교차표


3. 실습

3.1. 구글시트

3.2. 구글시트 함수

3.3. 실습강의


4. 용어와 수식

4.1. 용어


1. 애니메이션



4 × 4 교차표 : 이산확률분포




2 × 2 교차표 : 이항검정


2. 설명

2.1. 교차표

데이터로 교차표(cross table or contingency table)를 만듭니다. 두 개의 확률변수를 분류(categorize)하여 집단을 만들고 각 집단에 속하는 데이터의 빈도수를 확률변수가 교차하여 만들어진 칸(cell)에 나타냅니다. 교차표는 두 확률변수의  관계를 나타내는 표라고 할 수 있습니다. 교차표는 서로 다른 두 확률변수의 도수분포표를 2차원으로 확장하여 도수분포표의 구간이 교차하는 칸(cell)을 만들어서 빈도수를 적은 것입니다. 간단하게  2차원 도수분포표라고  할 수 있습니다.  연속형 데이터의 경우 도수분포표를 만들 때와 같이 구간을 나누어 빈도수를 조사한 다음 교차표를 만듭니다.

 

두 변수가 범주형 확률변수일때 교차표의 쓰임새는 여러가지 검정에 사용할 수 있습니다. 이 때 교차표는 한 변수의 속성(범주형 확률변수값, 수준)을 행에 놓고 나머지 변수의 속성(범주형 확률변수값, 수준)을 열에 놓아 셀(Cell)을 만듭니다. 행변수의 속성과 열변수의 속성이 교차하는 셀(cell)에  두 속성을 동시에 가지는 데이터의 빈도수를 넣습니다. 교차표를 작성하여 도수분포를 살펴보면 대략 두 변수 사이의 관계를 알 수 있습니다.  분석을 위해 각 셀의 빈도수 밑에 행의 합에 대한 백분율, 열의 합에 대한 백분율, 그리고 전체 백분율을 표시하기도 합니다.


3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


교차표 : 구글시트 실습

3.2. 구글시트 함수

=COUNTIF(C3:C22,”>=12″) : 조건에 맞는 데이터 개수. C3에서 C22 범위에 있는 데이터 중에서 12 이상의 데이터 개수를 세어서 표시함.

=SUM(G5:H5) : 합계. G5에서 H5에 있는 데이터들의 합계.


3.3. 실습강의

– 데이터

– 교차표

– 실습 안내



4. 용어와 수식

4.1 용어


빈도수

통계에서 사건의 빈도 (또는 절대 빈도)는 실험이나 연구에서 사건이 발생한 횟수입니다. 이러한 빈도수는 종종 히스토그램으로 표현됩니다.

 

Reference

Frequency (statistics) – Wikipedia



도수분포

통계에서 도수분포(빈도수분포)는 표본의 실험이나 측정항목의 빈도수를 표시하는 표(도수분포표)나 그래프(도수분포도)로 나타냅니다. 도수분포표의 각 항목에는 특정 집단 또는 특정 구간 내의 값이 발생하는 빈도수가 나타납니다. 도수분포표는 표본의 변수 분포를 요약하는 효과적인 방법입니다.

 

Reference

Frequency distribution – Wikipedia