QA : 8
DATA SCIENCE : 27
TABLE : 6
TERM : 3
eISSN 0000-0000

[ QA ]

p값은 이항집합의 확률인가?, 연속적인 집합의 확률인가?

CONTENTS

p값(p-value)은 연속적인 집합의 확률입니다.

p값은 연속적인 집합의 확률입니다.

p값은 관측된 데이터로 부터 구한 0에서 1사이의 실수입니다.  0에서 1사이의 실수는 주어진 누적분포함수(CDF)로 부터 구한 연속적인 집합의 확률입니다.   

p값은 관측된 데이터가 특정 통계 분포(예: 정규분포)에서 얼마나 극단적인지를 나타내는 값입니다.

귀무가설이 참이라는 가정 하에, p값은 “관측된 데이터보다 더 극단적인 통계량에 해당하는 확률공간의 원소들의 비율”을 나타냅니다. 이때 p값은 연속적인 확률공간 내에서 귀무가설을 기각할지 말지를 결정하는 “경계점” 역할을 합니다.

유의수준(α)과 p값을 비교함으로써, 우리는 귀무가설을 기각할지를 결정하는데, 이 과정에서 p값은 연속적인 확률공간에서 경계 역할을 하게 됩니다.

p값은 이항집합의 확률이 아닙니다.

이항 집합은 두 개의 상호 배타적인 결과(예: 성공/실패, 참/거짓)로 이루어진 집합을 의미합니다. 이 경우 확률은 두 가지 결과 중 하나가 발생할 가능성을 의미합니다.

p값은 이항적인 사건(두 가지 결과 중 하나)에 대한 확률이 아니라, 연속적인 확률공간(집합)에서  “관측된 통계량보다 더 극단적인 통계량을 얻을 확률”을 나타냅니다. 

유의수준은 이항집합의 확률인가?

유의수준(α)은 이항집합의 확률이라고 볼 수 있습니다. 이항집합이란 두 개의 상호 배타적인 결과(예: 성공/실패, 참/거짓)를 나타내는 집합을 의미하는데, 유의수준은 그 중 하나의 경우, 즉 귀무가설을 **잘못 기각하는 경우(제1종 오류, Type I error)**가 발생할 확률을 나타냅니다.

확률공간과 집합을 비교하면?

집합은 원소들의 모임입니다. 공간은 집합에 추가적인 구조를 부여한 것입니다. 예를 들어 확률공간은 집합에 확률측도가 부여된 경우, 즉 확률적으로 해석할 수 있는 구조가 추가된 집합입니다. 벡터공간은 원소들이 벡터이고 이들 사이에 덧셈과 스칼라곱셈이 정의된 집합입니다. 위상공간은 집합에 특정한 열린 집합들의 체계(위상)이 정의된 경우입니다. 

확률공간(Probability Space)의 세가지 요소

  1. 표본공간(Ω, Sample Space): 모든 가능한 결과들의 집합.
  2. 사건(Event) 또는 시그마대수(𝔽, Sigma Algebra): 사건은 표본공간의 부분집합으로, 특정 결과들의 집합을 의미하며 확률을 할당할 수 있는 단위입니다. 시그마대수는 표본공간의 부분집합들로 구성된 특정한 집합이며 확률을 부여할 수 있는 “측정 가능한” 사건들의 집합입니다.
  3. 확률측도(P, Probability Measure): 시그마대수에 포함된 사건에 확률을 할당하는 함수입니다.
두 영역으로 나눠진 연속적인 사건과 사건에 할당된 연속적인 확률