일원분산분석에서 F통계량, F검정통계량, F검정통계값의 관계는?

[ QA ] CONTENTS 귀무가설을 통해 , F통계량의 변수의 수를 줄여 F검정통계량을 구합니다. 여기서, 귀무가설은 알 지 못하는 모수에 대한 가설입니다. F검정통계량은 확률변수이며 정의된 확률분포함수로 표현합니다. 표본데이터를 통해, F검정통계량의 함수값인 F검정통계값을 구합니다. 일원분산분석에서 F통계량 일원분산분석에서의 F통계량을 함수로 보면 다음과 같이 표현할 수 있습니다. $$F(chi^2_B, df_B, chi^2_W, df_W) = dfrac{dfrac{chi^2_B}{df_B}}{dfrac{chi^2_W}{df_W}}= dfrac{dfrac{S_{B}^2}{sigma_{B}^2}}{dfrac{S_{W}^2}{sigma_{W}^2}}$$ 여기서, $chi^2_B$는 표본내 집단의 카이제곱: […]

t통계량, t검정통계량, t검정통계값의 관계는?

[ QA ] CONTENTS 귀무가설을 통해 , t통계량의 변수의 수를 줄여 t검정통계량을 구합니다. 여기서, 귀무가설은 알 지 못하는 모수에 대한 가설입니다. t검정통계량은 확률변수이며 정의된 확률분포함수로 표현합니다. 표본데이터를 통해, t검정통계량의 함수값인 t검정통계값을 구합니다. t통계량, t검정통계량, t검정통계값의 관계 t통계량을 함수로 보면 다음과 같습니다. $$t(bar{X}, mu, s, n) = dfrac{bar{X} – mu}{dfrac{s}{sqrt{n}}}$$ 여기서, $t$는 t통계량 $nu$는 자유도: $nu=n-1$ […]

모분산을 알고 표본크기가 작은 경우, Z검정과 t검정 중, 어느 검정?

[ QA ] CONTENTS Z검정입니다. Z검정과 t검정은 확률변수가 정규분포를 따르거나 표본크기가 30이상인 경우에 사용합니다. 확률변수가 정규분포를 따르지 않고 표본크기가 30미만인 경우는 비모수검정을 사용합니다. Z검정은 모분산을 아는 경우에 사용 모분산이 알려진 경우에는 표본크기와 관계없이 Z검정을 사용합니다. 모분산을 알면 모집단의 실제 변동성을 직접 반영할 수 있습니다. 따라서 자유도에 따른 보정이 필요하지 않습니다. 그러나 모분산을 아는 경우는 현실적으로 […]

검정통계량(Test statistic)은 확률변수?

[ QA ] CONTENTS 네, 검정통계량은 확률분포를 가지는 확률변수입니다. 무작위 표본으로부터 계산되는 통계량이기 때문입니다.  검정통계량은 무엇? 검정통계량은 주어진 표본 데이터에서 계산되는 통계량 중 하나입니다. 이 통계량은 모집단의 모수를 추정하거나 가설을 검정하는 데 사용되어 검정통계량이라고 부릅니다. 검정통계량은 특정 확률변수를 검정의 종류에 따른 확률분포의 확률변수로 변환하는 식이며, 이는 표본의 구성이나 크기에 따라 달라집니다. 예를 들어, t검정에서 사용되는 […]

p값은 이항집합의 확률인가?, 연속적인 집합의 확률인가?

[ QA ] CONTENTS p값(p-value)은 연속적인 집합의 확률입니다. p값은 연속적인 집합의 확률입니다. p값은 관측된 데이터로 부터 구한 0에서 1사이의 실수입니다.  0에서 1사이의 실수는 주어진 누적분포함수(CDF)로 부터 구한 연속적인 집합의 확률입니다.    p값은 관측된 데이터가 특정 통계 분포(예: 정규분포)에서 얼마나 극단적인지를 나타내는 값입니다. 귀무가설이 참이라는 가정 하에, p값은 “관측된 데이터보다 더 극단적인 통계량에 해당하는 확률공간의 원소들의 […]

유의수준이 임계값을 정하나?

[ Q&A ] CONTENTS 네, 유의수준이 먼저 정해지고 확률분포 정보를 더하여 임계값이 결정되므로 유의수준이 임계값을 정합니다. 유의수준과 임계값은 무엇? 유의수준(significance level)은 가설검정에서 귀무가설을 기각하는 기준이 되는 확률입니다. 일반적으로 $alpha$로 표시됩니다. 선행연구에 의해 주어집니다. 유의수준은 임계값을 설정하는 데 사용됩니다. 임계값 (critical value)은 귀무가설이 참이여서 귀무가설을 채택하는 영역과 귀무가설이 거짓이어서 귀무가설을 기각하는 영역의 경계값입니다. 임계값은 유의수준과 검정통계량의 […]

한우의 출생지와 출생년도에 따른 도체중의 ‘일원분산분석 F검정’과 ‘독립표본 t검정’

[ DATA SCIENCE ] Figure Animation 표1 표1 [Q&A] 집단이 2개 일 때 일원분산분석 F검정과 t검정의 결과가 같은 이유 집단이 2개일 경우, 일원분산분석에서 계산되는 F값은 독립표본 t검정에서의 t값의 제곱과 같게 됩니다. 두 검정 방법이 같은 통계적 추정치를 사용하여 두 집단 간의 차이만을 평가. 집단이 2개일 경우, 일원분산분석에서 계산되는 F값은 독립표본 t검정에서의 t값의 제곱과 같게 됩니다. […]

단순선형회귀의 결정계수 비교: 단순선형회귀분석 F검정

Animation Figure [Q&A] CONTENTS Author Detail Publication Histroy DOI Citation Download Print 구글문서 Print 구글문서 Abstract 프랜시스 갈톤은 1885년, 부모와 자식 간의 키 관계를 연구하며, 평균 키로의 회귀 경향을 발견했습니다. 이는 부모와 자식의 키 관계가 기울기가 1보다 작은 회귀직선으로 표현됨을 의미합니다. 회귀분석은 변수 간 함수관계를 파악하는 데 사용되며, 결과변수(종속변수)와 원인변수(독립변수) 간 관계를 모델링합니다. 단순선형회귀는 1개의 […]

두 연속형 확률변수의 상관계수 비교: 상관분석 t검정

Animation Figure [Q&A] CONTENTS Author Detail Publication Histroy DOI Citation Download Print 구글문서 Print 구글문서 Abstract 모수와 통계량 추정에서, 확률변수의 모평균, 모분산, 모표준편차는 각각 표본평균, 표본분산, 표본표준편차를 통해 추정됩니다. 상관분석은 두 변수 간의 선형적 관계를 측정하며, 피어슨상관계수는 이 관계의 강도와 방향을 수치화합니다. 공분산은 두 변수 간의 변동성을 나타내며, 상관계수는 공분산을 표준화한 값입니다. 상관계수의 제곱인 결정계수는 […]

교차표의 확률분포 비교: 교차분석 카이제곱검정

Animation Figure [Q&A] CONTENTS Author Detail Publication Histroy DOI Citation Download Print 구글문서 Print 구글문서 Abstract 교차분석은 범주형 변수 간의 관계를 분석하는 통계적 방법입니다. 예로, 대학교 학생의 학년과 영어학점 관계를 교차표로 나타내어 학년별 영어학점 분포의 동질성을 검정할 수 있습니다. 이는 학년이 영어학점에 미치는 영향을 평가하기 위함입니다. 교차표는 학년과 영어학점 조합의 빈도수를 표시하며, 전체 학생 집합에서 […]