DATA SCIENCE : 27
DATA SCIENCE eISSN

[ Q-data science ]

상대도수는 모비율 추정량의 실현값인가?

목차

네. 상대도수(relative frequency)는 모비율 추정량의 실현값입니다.

$$\hat{p}_{\mathrm{obs}} = \dfrac{x}{n}$$

여기서, $\hat{p}_{\mathrm{obs}}$은 관측된 표본의 상대도수

$x$는 실현된 성공회수

$n$은 표본크기

모비율은 특정 사건이 일어나는 데 성공하는 비율이며 알 수 없는 상수입니다.

$$\pi = P(\text{특정사건})$$

모비율 추정량은 표본비율(sample proportion)이며 분포를 가지는 확률변수입니다.

$$\hat{p} = \dfrac{X}{n}, \quad X \sim \mathrm{Binomial}(n, \pi)$$

여기서, $\hat{p}$은 모비율 추정량

 

1. 모수의 추정

표본으로 모집단을 추정합니다. 모집단을 표본으로 추정하는 추정량은 확률변수입니다. 이 확률변수의 실현값을 추정값(추정치)라고 부릅니다.

Table 1. 모수와 모수의 추정량과 그 추정값

용어 영어 설명 특징 확률변수 여부 예시(수학기호)
모수 parameter 모집단을 표현하는 값 알 수 없지만 고정된 상수 확률변수 아님 모평균(𝜇), 모비율(𝜋), 모분산(𝜎²)
추정량 estimator 표본데이터로 모수를 추정하는 계산식 표본에 따라 값이 달라지는 확률변수 확률변수 표본평균(𝑋̄), 표본비율(𝜋̂), 표본분산(S²)
추정값 estimate 표본데이터로 계산한 모수 추정량의 실제 계산된 수치 추정량의 실현값, 고정된 수치 확률변수 아님 표본평균 실현값(37.2), 표본비율 실현값(0.26), 표본분산 실현값(15.4)

2. 모비율의 추정

모비율($\pi$)은 모집단 전체에서 어떤 사건이 일어날 확률이며 고정된 값입니다. 상대도수($\hat{p}$)는 표본에서 해당사건이 일어난 횟수를 전체 표본 수로 나눈 값입니다. 상대도수는 모비율 추정량의 실현값입니다. 즉, 상대도수는 표본에서 관측된 모비율의 추정값입니다.

사건 A의 모비율

$$\pi=\mathrm{P}(A)$$

상대도수(표본비율)

$$\hat {p}=\dfrac{\text{사건A가 발생한 회수}}{\text{표본크기}}$$

상대도수는 추정량의 실현값이며 다음과 같은 확률분포를 가지는 확률변수입니다.

$$\hat{p} \sim \dfrac{\mathrm{Binomial}(n, \pi)}{n}$$

 

Fig. 1. 모비율이 0.6일 때,  표본크기가 50인 표본비율(모비율 추정량)의 확률분포