DATA SCIENCE : 27
DATA SCIENCE eISSN

[ QA ]

표본평균을 사건(event)으로 보아 확률을 부여할 수 있나?

목차

네, 그렇습니다.

표본평균은 표본집단 전체를 대변하는 사건으로 해석될 수 있습니다.

표본평균은 사건이므로 확률공간 위에서 확률을 직접 부여할 수 있습니다.

표본평균을 사건으로 보는 것은 가설검정의 “표본평균이 특정 값을 가지는 사건”, 베이즈 정리의 “데이터(사건)를 조건으로 한 사후확률”, 기댓값의 “사건의 확률중심(moment)” 같은 모든 확률적 연산을 가능하게 하는 이론적 기반을 제공합니다.

1. 표본평균과 사건 그리고 확률

표본공간을 실수공간 $\mathbb{R}^n$이라 하면, 한 번의 표본추출은 $\mathbb{R}^n$의 한 점, 표본벡터를 선택하는 사건입니다. 

$$
\mathbf{x} = (x_1, \ldots, x_n)
$$

표본평균 $\bar{Y}$는 이 표본집합을 대표하는 가측함수이자 사건의 표현형입니다. 다시 말해, $\bar{Y}$는 표본집합이라는 사건의 상태(state)를 나타내는 값입니다. 따라서 “표본평균이 발생한다”는 말은 $\mathbb{R}^n$ 공간 내에서 특정한 사건이 실현된다는 의미이므로, 표본평균 자체가 사건으로 간주될 수 있습니다.

확률공간 $(\mathbb{R}^n, \mathcal{B}^n, P)$ 위에서는 $\bar{Y}$에 대한 확률이 다음과 같이 직접 정의됩니다. 즉, 표본평균이 나타내는 사건에 확률이 직접 부여됩니다.

$$
dP = f(\bar{y})\, d\bar{y}
$$

2. 표본평균의 정의 공간축소

실수공간을 표본공간으로 하는 확률공간 $(\mathbb{R}^n, \mathcal{B}^n, P)$을 고려하면, $\mathcal{B}^n$은 실수공간 $\mathbb{R}^n$에서 생성된 보렐 σ-대수이며, $P$는 이에 정의된 확률측도입니다. 표본을 구성하는 확률변수를 $Y_1, Y_2, \dots, Y_n$이라 할 때, 표본평균은 다음과 같이 정의됩니다.

$$
\bar{Y} = \frac{1}{n} \sum_{i=1}^{n} Y_i
$$

이때 $\bar{Y}$는 실수공간 $\mathbb{R}^n$에서 실수공간 $\mathbb{R}$로의 가측사상(measurable mapping)이며, 이는 확률공간의 차원을 축소시키는 공간축소(space reduction) 입니다. 즉, $n$차원 공간의 한 점 $(Y_1, \dots, Y_n)$을 1차원 실수값 $\bar{Y}$로 사상함으로써, 확률공간 $(\mathbb{R}^n, \mathcal{B}^n, P)$가 $(\mathbb{R}, \mathcal{B}, P_{\bar{Y}})$로 축소됩니다.

이 사상에 의해 각 표본평균 $\bar{y}$는 $\mathbb{R}^n$ 상의 한 점으로서 확률이 직접 부여되는 사건(event) 으로 해석됩니다. 즉, 표본평균이 특정 구간에 속한다는 조건 없이도 $\bar{Y}$ 자체에 확률이 명시적으로 부여될 수 있습니다. 확률밀도함수 $f(\bar{y})$가 존재할 때, 사건 $\bar{Y}$에 대한 확률은 다음과 같이 표현됩니다.

$$
(\mathbb{R}^n, \mathcal{B}^n, P) \xrightarrow{\;Y\;} (\mathbb{R}, \mathcal{B}, P_{\bar{Y}})
$$

여기서, $\mathbb{R}^n$ : $n$개의 실수표본으로 구성된 표본공간

$\mathcal{B}^n$ 는 실수공간에서 생성된 보렐 σ-대수

$P$는 확률측도(probability measure)

따라서 표본평균은 단순한 통계량이 아니라, 실수공간을 표본공간으로 하는 확률공간에서 확률이 직접 부여되는 사건으로 존재하며, 그 사건의 확률은 공간축소된 측도 $P_{\bar{Y}}$를 통해 정의됩니다. 결국, 표본평균 $\bar{Y}$는 실수공간 $\mathbb{R}^n$에서 1차원 실수공간 $\mathbb{R}$로의 공간축소를 통해 확률이 직접 부여되는 사건으로 해석되며, 확률론의 측도적 구조 안에서 완전한 사건이 됩니다. 

$$
dP = f(\bar{y})\, d\bar{y}
$$

3. 표본평균 사건과 가설검정

표본평균 $\bar{Y}$를 사건으로 보는 관점은 가설검정의 전 과정을 확률공간 위의 사건 간의 관계로 해석하게 합니다. 즉, 귀무가설 $H_0$와 대립가설 $H_1$은 각각 실수공간 $\mathbb{R}^n$의 사건이며, 표본평균 $\bar{Y}$는 그 사건들 사이의 확률적 구분을 가능하게 하는 공간축소된 사건(space-reduced event) 으로 기능합니다.

4. 조건부확률과 베이즈 정리의 해석

표본평균 $\bar{Y}$를 사건(event)으로 해석하면, 조건부확률과 베이즈 정리 또한 공간축소된 확률공간 위에서 직관적이면서도 엄밀하게 정의할 수 있습니다. 확률공간 $(\mathbb{R}^n, \mathcal{B}^n, P)$에서 표본평균에 의한 사상은 공간축소(mapping)로서 $(\mathbb{R}, \mathcal{B}, P_{\bar{Y}})$를 생성합니다. 이때 $\bar{Y}$에 의해 정의되는 각 사건은 $\mathcal{B}$의 원소로서 직접 확률이 부여됩니다.

$$
\bar{Y} : \mathbb{R}^n \rightarrow \mathbb{R}
$$

조건부확률은 이러한 공간축소된 사건들 간의 관계로 표현됩니다. 예를 들어, 두 사건 $A, B \in \mathcal{B}$에 대하여 $\bar{Y}$ 공간에서의 조건부확률은 다음과 같이 정의됩니다.

$$
P(A \mid B) = \frac{P(A \cap B)}{P(B)}, \quad P(B) > 0
$$

이 정의는 원래의 $n$차원 공간 $(\mathbb{R}^n, \mathcal{B}^n, P)$에서도 동일하게 성립하며,
단지 $\bar{Y}$에 의해 축소된 공간에서 그 사건들이 1차원적으로 표현된다는 점만 다릅니다. 따라서, 공간축소에 의해 사건의 차원이 감소하더라도 그 사건들 간의 확률 관계(비율)는 그대로 유지됩니다. 이 점이 확률론의 가장 큰 구조적 강점입니다.  이제 이러한 조건부확률 개념은 베이즈 정리(Bayes’ theorem)의 형태로 확장됩니다. 서로 배반인 가설 사건들이 ${H_1, H_2, \dots, H_k}$이고, 표본평균 사건이 $\bar{Y}$로 주어졌을 때, 각 가설에 대한 사후확률은 다음과 같이 정의됩니다.

$$
P(H_i \mid \bar{Y}) =
\frac{P(\bar{Y} \mid H_i)\, P(H_i)}
{\sum_{j=1}^{k} P(\bar{Y} \mid H_j)\, P(H_j)}
$$

여기서, $P(\bar{Y} \mid H_i)$는 가설 $H_i$ 하에서 표본평균 사건 $\bar{Y}$가 일어날 확률

$P(H_i)$는 사전확률(prior probability)

$P(H_i \mid \bar{Y})$는 사후확률(posterior probability)

이 식에서 $\bar{Y}$는 단순한 데이터 요약값이 아니라, 확률이 직접 부여되는 사건이므로 조건부확률의 대상이자 근거로서 의미를 갖습니다. 즉, $\bar{Y}$가 사건으로 정의되어 있기에 가설 $H_i$와 $\bar{Y}$의 결합확률 $P(H_i \cap \bar{Y})$ 및 비례관계 $P(H_i \mid \bar{Y}) \propto P(\bar{Y} \mid H_i)P(H_i)$가 수학적으로 정당화됩니다.

결국, 표본평균 $\bar{Y}$를 사건으로 보는 관점은 조건부확률과 베이즈 정리를 공간축소된 확률공간 위에서 완전하게 해석할 수 있게 하며, 이는 확률론이 가지는 구조적 일관성과 통계적 추론의 논리적 기반을 동시에 제공합니다.