DATA ARTICLE : 1
LEARNING ARTICLE : 6
6 Weeks in Review
2 Weeks in Publication
Open Access
Peer Reviewed
DATALINK FORUM eISSN

확률이론에서 표본공간과 벡터공간을 연결하는 함수는?

CONTENTS 양적 확률변수(quantitative random variable) 또는 양적 확률벡터(quantitative random vector)입니다. 확률변수  또는 확률벡터를 함수라고 하는 이유는 표본공간의 원소를 벡터공간의 점 또는 점의 집합으로 변환하는 기능을 하기 때문입니다.  확률변수를 기호로 표현하면 다음과 같습니다. $$X : Omega to mathbb{R}$$ 여기서, $X$는 양적(수치형) 확률변수 $Omega$는 표본공간 $mathbb{R}$는 $1$차원 벡터공간 확률벡터를 기호로 표현하면 다음과 같습니다. $$X : Omega to […]

확률이론에서의 표본과 통계학에서의 표본은 의미가 같은가?

CONTENTS 아니오, 용어는 같지만 의미는 다릅니다. 확률이론에서의 표본은 표본공간의 원소로서 더 이상 나눌 수 없는 사건의 결과입니다. 통계학에서의 표본은 모집단의 부분집합으로서 모집단의 특성을 추정합니다. 확률이론에서의 표본 확률이론(probability theory)에서는 확률공간(probability space)으로 확률(probability)을 설명합니다. 확률공간의 3요소는 표본공간(sample space), 시그마대수($sigma$-algebra), 확률측도(probility measure) 입니다. 표본공간에서 나올 수 있는 단일 결과를 표본(sample)이라고 합니다. 이는 더 이상 나눌 수 없는 개별적인 […]

모든 집단의 평균이 같을 때, 모집단내 “집단간분산”과 “집단내분산”이 같은 이유는?

[ QA ] CONTENTS “집단내변동”만으로 두 분산이 정해지기 때문입니다. 모든 집단의 평균이 같다면 “집단간변동”은 없습니다. 분산분석(ANOVA)의 기본 개념 총변동($SS_T$)은 전체 데이터의 변동성을 나타내며, 집단간변동($SS_B$)과 집단내변동($SS_W$)의 합으로 표현됩니다. $$SS_T=SS_B+SS_W$$ $MS_B$은 집단간분산이며 집단평균의 변동입니다. 집단간변동과의 관계는 다음식으로 표현됩니다 $$MS_B = dfrac{SS_B}{text{집단간 자유도}}$$ $MS_W$은 집단내분산이며 각 집단내에서 데이터의 변동입니다. 집단내변동과의 관계는 다음식으로 표현됩니다. $$MS_W = dfrac{SS_W}{text{집단내 자유도}}$$​ 등분산 […]

모집단에서 집단간분산과 집단내분산이 동일해지는 경우는?

CONTENTS 모집단내 각 집단의 모평균이 같을 때 입니다. 이 경우, 집단간분산과 집단내분산은 모집단의 분산을 추정합니다. 무한 모집단(population) 내 각 집단(group)의 크기도 무한대입니다. 모집단내 집단의 변동 모집단에서 무작위로 표본을 추출할 때, 그 표본이 충분히 크면, 즉, 표본의 크기가 무한대에 가까워지면, 그 표본은 모집단의 특성을 정확하게 반영합니다. 아찬가지로 모집단내 집단 간의 평균이 같을 때 집단간 변동의 차이는 […]

일원분산분석에서 F통계량, F검정통계량, F검정통계값의 관계는?

CONTENTS 귀무가설을 통해 , F통계량의 변수의 수를 줄여 F검정통계량을 구합니다. 여기서, 귀무가설은 알 지 못하는 모수에 대한 가설입니다. F검정통계량은 확률변수이며 정의된 확률분포함수로 표현합니다. 표본데이터를 통해, F검정통계량의 함수값인 F검정통계값을 구합니다. 일원분산분석에서 F통계량 일원분산분석에서의 F통계량을 함수로 보면 다음과 같이 표현할 수 있습니다. $$F(chi^2_B, df_B, chi^2_W, df_W) = dfrac{dfrac{chi^2_B}{df_B}}{dfrac{chi^2_W}{df_W}}= dfrac{dfrac{S_{B}^2}{sigma_{B}^2}}{dfrac{S_{W}^2}{sigma_{W}^2}}$$ 여기서, $chi^2_B$는 표본내 집단의 카이제곱: $chi^2_B=df_Bdfrac{S_B^2}{sigma_B^2}$ $chi^2_W$는 표본내 […]

t통계량, t검정통계량, t검정통계값의 관계는?

CONTENTS 귀무가설을 통해 , t통계량의 변수의 수를 줄여 t검정통계량을 구합니다. 여기서, 귀무가설은 알 지 못하는 모수에 대한 가설입니다. t검정통계량은 확률변수이며 정의된 확률분포함수로 표현합니다. 표본데이터를 통해, t검정통계량의 함수값인 t검정통계값을 구합니다. t통계량, t검정통계량, t검정통계값의 관계 t통계량을 함수로 보면 다음과 같습니다. $$t(bar{X}, mu, s, n) = dfrac{bar{X} – mu}{dfrac{s}{sqrt{n}}}$$ 여기서, $t$는 t통계량 $nu$는 자유도: $nu=n-1$ $n$은 표본크기 $Gamma(,,,)$는 […]

집단간분산과 집단내분산이 같다는 것은?

[ QA ] CONTENTS 범주형 원인변수에 의한 분산과 내재된 분산이 같다는 의미입니다. 신호와 노이즈의 양이 같다는 의미입니다. 집단간분산이 집단내분산보다 작은 구역은 중첩되어 있는 영역입니다. 큰 영역은 확실히 범주형 원인변수가 작동하는 영역입니다. 집단간분산과 집단내분산은 무엇? 집단간분산(Between-Group Variance)은 서로 다른 집단의 평균값 차이를 설명합니다. 즉, 각 집단의 평균이 전체 평균(또는 다른 집단의 평균)과 얼마나 차이가 나는지를 나타냅니다. […]

표본분산을 카이제곱으로 변환하는 이유는?

[ QA ] CONTENTS 카이제곱은 표준정규분포에서 유도된 확률분포를 가지기 때문입니다. 표본분산을 카이제곱변환하는 과정에서 자유도의 정보가 포함됩니다. 유사하게, 표본평균을 Z변환하는 과정에서 표본크기의 정보가 포함됩니다. 확률변수의 확률분포: 정규분포로 모델링 확률변수의 확률분포: 정규분포로 모델링 $$Y sim N(mu_Y, sigma^2_Y)$$ 여기서, $Y$는 확률변수 $N(mu_Y, sigma^2_Y)$는 $mu_Y$와 $sigma^2_Y$를 매개변수로 하는 정규분포 $mu_Y$는 확률변수 $Y$의 모평균 $sigma^2_Y$는 확률변수 $Y$의 모분산 확률변수의 확률밀도함수 […]

모분산을 알고 표본크기가 작은 경우, Z검정과 t검정 중, 어느 검정?

CONTENTS Z검정입니다. Z검정과 t검정은 확률변수가 정규분포를 따르거나 표본크기가 30이상인 경우에 사용합니다. 확률변수가 정규분포를 따르지 않고 표본크기가 30미만인 경우는 비모수검정을 사용합니다. Z검정은 모분산을 아는 경우에 사용 모분산이 알려진 경우에는 표본크기와 관계없이 Z검정을 사용합니다. 모분산을 알면 모집단의 실제 변동성을 직접 반영할 수 있습니다. 따라서 자유도에 따른 보정이 필요하지 않습니다. 그러나 모분산을 아는 경우는 현실적으로 거의 없습니다. 모분산을 […]

검정통계량(Test statistic)은 확률변수?

CONTENTS 네, 검정통계량은 확률분포를 가지는 확률변수입니다. 무작위 표본으로부터 계산되는 통계량이기 때문입니다.  검정통계량은 무엇? 검정통계량은 주어진 표본 데이터에서 계산되는 통계량 중 하나입니다. 이 통계량은 모집단의 모수를 추정하거나 가설을 검정하는 데 사용되어 검정통계량이라고 부릅니다. 검정통계량은 특정 확률변수를 검정의 종류에 따른 확률분포의 확률변수로 변환하는 식이며, 이는 표본의 구성이나 크기에 따라 달라집니다. 예를 들어, t검정에서 사용되는 t통계량은 표본의 표본평균 […]