Frequentist에게 “귀무가설”이 있다면 Bayesian에게는?
[ QA ] CONTENTS Bayesian에게는 “사전확률”이 있습니다. Frequentist와 Bayesian은 누구? Frequentist(프리퀀티스트, 빈도주의자)은 빈도주의 접근법을 따르는 사람입니다. 이들은 확률을 반복 실험에서 나타나는 빈도로 해석하며, 주어진 데이터를 통해 객관적인 추론을 수행합니다. 사전확률을 사용하지 않으며, 데이터 자체에 기반하여 가설을 검정하고 신뢰구간을 추정합니다. Bayesian(베이지앙, 사후확률추구자)은 베이지안 접근법을 따르는 사람입니다. 이들은 확률을 주관적인 믿음의 정도로 해석하며, 새로운 증거를 사용하여 사전확률(prior […]
대응표본처럼 독립표본도 순차적으로 수집할 수 있나?
[ QA ] CONTENTS 네, 독립표본도 시간적, 공간적으로 순차적으로 관측한 결과일 수 있습니다. 대응표본과 독립표본은 무엇? 표본은 대응표본(paired samples)과 독립표본(independent samples)들로 이루어져 있다고 볼 수 있습니다. 한편, 표본은 개체속성의 실현된 값의 모음입니다. 개체의 두 속성이 서로 대응되면 대응표본이고 두 속성이 서로 독립되면 독립표본이라고 합니다. 그리고 개체의 한 속성을 반복측정한 것도 대응표본이라 할 수 있습니다. 대응표본의 […]
유의수준이 임계값을 정하나?
CONTENTS 네, 유의수준이 먼저 정해지고 확률분포 정보를 더하여 임계값이 결정되므로 유의수준이 임계값을 정합니다. 유의수준과 임계값은 무엇? 유의수준(significance level)은 가설검정에서 귀무가설을 기각하는 기준이 되는 확률입니다. 일반적으로 $alpha$로 표시됩니다. 선행연구에 의해 주어집니다. 유의수준은 임계값을 설정하는 데 사용됩니다. 임계값 (critical value)은 귀무가설이 참이여서 귀무가설을 채택하는 영역과 귀무가설이 거짓이어서 귀무가설을 기각하는 영역의 경계값입니다. 임계값은 유의수준과 검정통계량의 분포에 따라 결정됩니다. […]
데이터사이언스 학습을 위해 생성한 가상 딸기 데이터셋

그림 애니메이션 목차 요약영상 1 Videos 준비중 0:03 저자정보 출판이력 DOI 인용 다운로드 Print 구글문서 Print 구글문서 요약 데이터사이언스 분야는 빠르게 발전하고 있으며, 고품질 데이터셋에 대한 접근은 학습과 연구에 필수적이다. 그러나 실제 데이터를 수집하는 과정은 비용이 많이 들고 접근이 어렵다. 이러한 문제를 해결하고, 효과적인 데이터사이언스 교육을 위한 합성 데이터셋을 생성하였다. 이 데이터셋은 딸기의 상품 가치를 […]
좌표계
애니메이션 그림 1차원 좌표계 2차원 좌표계 3차원 좌표계 1차원 좌표계 2차원 좌표계 3차원 좌표계 1차원 좌표계 2차원 좌표계 3차원 좌표계 1차원 좌표계 2차원 좌표계 3차원 좌표계 목차 요약영상 3 Videos 1차원 좌표계 0:07 2차원 좌표계 0:12 3차원 좌표계 0:20 저자정보 출판이력 DOI 인용 다운로드 Print 구글문서 Print 구글문서 요약 1차원 좌표계에서는 변수 값을 점으로 나타내며, […]
딸기의 상품가치

목차 Author Detail Publication Histroy DOI Citation Download Print 구글문서 Print 구글문서 요약 본 프로젝트의 목적은 가상 딸기의 속성을 표현하는 확률모델과 통계모델을 통해 데이터셋을 생성하고, 이를 통해 “p값으로 가설을 검정하는 실습 루틴”을 개발하는 것입니다. 가상의 딸기 품종을 설과 아키로 명명하고, 딸기의 속성을 원인변수와 결과변수로 구분했습니다. 당도는 딸기의 상품가치를 나타내며, 결과변수로 정규분포를 따르는 연속형 확률변수로 모델링되었습니다. […]
통계 용어
TERM 데이터 용어 확률 용어 통계 용어 데이터사이언스 용어 – Wikipedia 용어 영문 용어 표기 표기 설명 유사 용어 용어 설명 통계량 statistic 표본평균: $bar{Y}$ 표본분산: $S^2_Y$ 표본비율: $hat p$ 영 이탤릭 대문자에 바(bar)를 씌움 $bar Y$ 영 이탤릭 대문자 $S^2$ 영 이탤릭 소문자에 모자(hat)을 씌움 $hat p$ 추정량(estimator) 통계적 특성 (statistical property) 지표(indicator) 표본에서 […]
확률 용어
TERM 데이터 용어 확률 용어 통계 용어 데이터사이언스 용어 – Wikipedia 용어 영문 용어 표기 예 표기 설명 유사 용어 용어 설명 확률 probability $P$ $Pr$ $p$ 영 이탤릭 대문자 $P$ 영 이탤릭 대문자 $Pr$ 영 이탤릭 소문자 $p$ 가능성 확률은 범주에 부여되나 범주의 크기가 무한소가 되면 속성값이 되며 확률은 확률밀도가 됨 판정의 기준이 되는 […]
데이터 용어
TERM 데이터 용어 확률 용어 통계 용어 데이터사이언스 용어 – Wikipedia 용어 영문 용어 표기 예 표기 설명 유사 용어 용어 설명 변수 variable $x$, $y$ 영 이탤릭 소문자 특성(feature), 속성(attribute),항목(item), 지표(indicator),측정값(measurement),필드(field), 인자(factor) 변화하는 값을 표현하거나 정의하는 데 사용 代數式에서 어떤 값이 들어갈 수 있는 자리 확률변수 random variable, probability variable $X$, $Y$ 영 이탤릭 […]
분위표
TABLE 분위표 도수분포표 변동표 분산분석표 모수 가설검정표 비모수 가설검정표 가설검정 분류표 곱적분변환 분류표 곱합변환 분류표 표준정규분포에서의 4분위 : 4분위는 같은 확률(기대빈도수)을 가지는 4개의 이어진 범주 분위 속성 표준정규분포 4분위 1/4분위 2/4분위 3/4분위 4/4분위 확률 0.25 0.25 0.25 0.25 4분위수 1/4분위수 $approx -0.67449$ 2/4분위수 $= 0$ 3/4분위수 $approx 0.67449$ 4/4분위수$ = infty $ 100분위수 25/100분위수$ approx […]