조건부기대값의 분산과 조건부분산의 기대값의 합은?
CONTENTS 종속변수의 전체분산입니다. 전체분산법칙(Law of total variance) $$text{Var}left[Yright]=text{Var}left[text{E}[Y|X]right]+text{E}left[text{Var}[Y|X]right]$$ 전체분산법칙 전체분산법칙(Law of total variance)은 다음과 같이 표현됩니다. $$text{Var}left[Yright]=text{Var}left[text{E}[Y|X]right]+text{E}left[text{Var}[Y|X]right]$$ 여기서, $text{Var}[Y]$는 종속변수($Y$)의 전체분산 $text{Var}left[text{E}[Y|X]right]$는 독립변수($X$)로 인한 종속변수($Y$)의 기대값 변동 $text{E}left[text{Var}[Y|X]right]$는 독립변수($X$)로 인한 종속변수($Y$)의 분산의 기대값: 모델이 설명하지 못하는 변동 선형회귀모델에서의 전체분산법칙 선형회귀모델은 다음과 같습니다. $$Y=beta_0+beta_1X+epsilon$$ 여기서 $Y$는 종속변수 $X$는 독립변수 $beta_0$는 기울기(회귀계수) $epsilon$은 오차항 : $epsilon sim […]
배타적 사건은 독립사건인가, 종속사건인가?
CONTENTS 일반적으로, 배타적 사건은 종속사건입니다. 배타적 사건은 한 사건이 일어나면 또 다른 사건은 일어나지 않도록 영향을 주므로 종속사건입니다. 특별히, 적어도 하나의 사건의 확률이 0이면 배타적 사건은 독립사건입니다. 배타적 사건 배타적 사건 (mutually exclusive events)이란 동시에 발생할 수 없는 사건을 말합니다. 즉, 한 사건이 발생하면 다른 사건은 반드시 발생하지 않습니다. 확률로 표현 두 사건 $A$와 $B$가 […]
연속형 확률변수가 유리수로 실현될 확률은?
CONTENTS 연속형 확률변수가 유리수로 실현될 확률은 0입니다. 연속형 확률변수가 무리수로 실현될 확률은 1입니다. 실수의 확률공간 실수는 유리수와 무리수로 구성됩니다. $$mathbb{R} = mathbb{Q} cup (mathbb{R} setminus mathbb{Q})$$ 여기서, $mathbb{R}$은 실수 $mathbb{Q}$는 유리수 $(mathbb{R} setminus mathbb{Q})$은 무리수: $mathbb{R}$집합에서 $ mathbb{Q}$집합을 뺀 집합 유리수와 무리수는 서로소(disjoint) 관계인 배타적인 집합입니다. $$mathbb{Q} cap (mathbb{R} setminus mathbb{Q}) = emptyset$$ 여기서, $emptyset$은 […]
확률이론에서 표본공간과 벡터공간을 연결하는 함수는?
CONTENTS 양적 확률변수(quantitative random variable) 또는 양적 확률벡터(quantitative random vector)입니다. 확률변수 또는 확률벡터를 함수라고 하는 이유는 표본공간의 원소를 벡터공간의 점 또는 점의 집합으로 변환하는 기능을 하기 때문입니다. 확률변수를 기호로 표현하면 다음과 같습니다. $$X : Omega to mathbb{R}$$ 여기서, $X$는 양적(수치형) 확률변수 $Omega$는 표본공간 $mathbb{R}$는 $1$차원 벡터공간 확률벡터를 기호로 표현하면 다음과 같습니다. $$X : Omega to […]
확률이론에서의 표본과 통계학에서의 표본은 의미가 같은가?
CONTENTS 아니오, 용어는 같지만 의미는 다릅니다. 확률이론에서의 표본은 표본공간의 원소로서 더 이상 나눌 수 없는 사건의 결과입니다. 통계학에서의 표본은 모집단의 부분집합으로서 모집단의 특성을 추정합니다. 확률이론에서의 표본 확률이론(probability theory)에서는 확률공간(probability space)으로 확률(probability)을 설명합니다. 확률공간의 3요소는 표본공간(sample space), 시그마대수($sigma$-algebra), 확률측도(probility measure) 입니다. 표본공간에서 나올 수 있는 단일 결과를 표본(sample)이라고 합니다. 이는 더 이상 나눌 수 없는 개별적인 […]
모든 집단의 평균이 같을 때, 모집단내 “집단간분산”과 “집단내분산”이 같은 이유는?
[ QA ] CONTENTS “집단내변동”만으로 두 분산이 정해지기 때문입니다. 모든 집단의 평균이 같다면 “집단간변동”은 없습니다. 분산분석(ANOVA)의 기본 개념 총변동($SS_T$)은 전체 데이터의 변동성을 나타내며, 집단간변동($SS_B$)과 집단내변동($SS_W$)의 합으로 표현됩니다. $$SS_T=SS_B+SS_W$$ $MS_B$은 집단간분산이며 집단평균의 변동입니다. 집단간변동과의 관계는 다음식으로 표현됩니다 $$MS_B = dfrac{SS_B}{text{집단간 자유도}}$$ $MS_W$은 집단내분산이며 각 집단내에서 데이터의 변동입니다. 집단내변동과의 관계는 다음식으로 표현됩니다. $$MS_W = dfrac{SS_W}{text{집단내 자유도}}$$ 등분산 […]
모집단에서 집단간분산과 집단내분산이 동일해지는 경우는?
CONTENTS 모집단내 각 집단의 모평균이 같을 때 입니다. 이 경우, 집단간분산과 집단내분산은 모집단의 분산을 추정합니다. 무한 모집단(population) 내 각 집단(group)의 크기도 무한대입니다. 모집단내 집단의 변동 모집단에서 무작위로 표본을 추출할 때, 그 표본이 충분히 크면, 즉, 표본의 크기가 무한대에 가까워지면, 그 표본은 모집단의 특성을 정확하게 반영합니다. 아찬가지로 모집단내 집단 간의 평균이 같을 때 집단간 변동의 차이는 […]
일원분산분석에서 F통계량, F검정통계량, F검정통계값의 관계는?

CONTENTS 귀무가설을 통해 , F통계량의 변수의 수를 줄여 F검정통계량을 구합니다. 여기서, 귀무가설은 알 지 못하는 모수에 대한 가설입니다. F검정통계량은 확률변수이며 정의된 확률분포함수로 표현합니다. 표본데이터를 통해, F검정통계량의 함수값인 F검정통계값을 구합니다. 일원분산분석에서 F통계량 일원분산분석에서의 F통계량을 함수로 보면 다음과 같이 표현할 수 있습니다. $$F(chi^2_B, df_B, chi^2_W, df_W) = dfrac{dfrac{chi^2_B}{df_B}}{dfrac{chi^2_W}{df_W}}= dfrac{dfrac{S_{B}^2}{sigma_{B}^2}}{dfrac{S_{W}^2}{sigma_{W}^2}}$$ 여기서, $chi^2_B$는 표본내 집단의 카이제곱: $chi^2_B=df_Bdfrac{S_B^2}{sigma_B^2}$ $chi^2_W$는 표본내 […]
t통계량, t검정통계량, t검정통계값의 관계는?

CONTENTS 귀무가설을 통해 , t통계량의 변수의 수를 줄여 t검정통계량을 구합니다. 여기서, 귀무가설은 알 지 못하는 모수에 대한 가설입니다. t검정통계량은 확률변수이며 정의된 확률분포함수로 표현합니다. 표본데이터를 통해, t검정통계량의 함수값인 t검정통계값을 구합니다. t통계량, t검정통계량, t검정통계값의 관계 t통계량을 함수로 보면 다음과 같습니다. $$t(bar{X}, mu, s, n) = dfrac{bar{X} – mu}{dfrac{s}{sqrt{n}}}$$ 여기서, $t$는 t통계량 $nu$는 자유도: $nu=n-1$ $n$은 표본크기 $Gamma(,,,)$는 […]
집단간분산과 집단내분산이 같다는 것은?

[ QA ] CONTENTS 범주형 원인변수에 의한 분산과 내재된 분산이 같다는 의미입니다. 신호와 노이즈의 양이 같다는 의미입니다. 집단간분산이 집단내분산보다 작은 구역은 중첩되어 있는 영역입니다. 큰 영역은 확실히 범주형 원인변수가 작동하는 영역입니다. 집단간분산과 집단내분산은 무엇? 집단간분산(Between-Group Variance)은 서로 다른 집단의 평균값 차이를 설명합니다. 즉, 각 집단의 평균이 전체 평균(또는 다른 집단의 평균)과 얼마나 차이가 나는지를 나타냅니다. […]