대표값

[DATA SCIENCE] 데이터사이언스 > 데이터 > 데이터설명 > 통계량 [Q&A] 딸기의 가치는 당도인가? 저온숙성은 딸기의 당도를 향상시키는가? 당도 측정도구에 적용된 척도는? 대응표본과 독립표본은 무엇이 다른가? 대응표본과 독립표본에서 새로운 확률변수를 확률변수값의 차이라고 할 때 어느 표본의 분산이 더 큰가? 차이평균의 귀무가설과 원점의 관계는? 표준편차는 단위가 될 수 있는가? t검정? [Q&A] ARTICLE CONTENTS 확률밀도함수 0:10 회귀점 0:27 […]

분포값

[DATA SCIENCE] 데이터사이언스 > 데이터 > 데이터설명 > 통계량 [Q&A] ARTICLE CONTENTS 당도. 당도편차, 당도편차제곱 0:10 Data & Code 1:09 Measure of dispersion Print Abstract 집단의 분포값은 집단의 산포도 또는 변산성을 나타내며, 분산, 표준편차, 범위 등을 포함합니다. 분산은 각 데이터 값과 평균과의 차이를 제곱한 후 평균을 내어 계산하며, 이로 인해 데이터 값들이 평균에서 얼마나 멀리 […]

산점도

[DATA SCIENCE] 데이터사이언스 > 데이터 > 데이터시각화 > 개체의 시각화 [Q&A] ARTICLE CONTENTS 2차원 산점도 (1) 0:29 2차원 산점도 (2) 0:24 3차원 산점도 0:11 Scatter plot PDF Abstract 산점도는 직교좌표계에서 개체를 점으로 표현합니다. 1차원 산점도는 직선좌표계에서 개체를 점으로 표시하며, 2차원 산점도는 평면좌표계에서 개체의 두 속성을 좌표로 가지는 점으로 개체를 나타냅니다. 3차원 산점도는 공간좌표계에서 세 변수의 […]

데이터종류

[DATA SCIENCE] 데이터사이언스 > 데이터 > 데이터수집 > 데이터분류 [Q&A] ARTICLE CONTENTS 데이터종류 0:17 Play Video Data Type Print Abstract 관측대상의 속성에 따라 데이터는 범주형, 순서 있는 범주형, 이산형, 연속형으로 구분됩니다. 범주형 데이터는 관측대상이 속하는 범주를 나타내며, 순서 있는 범주형은 순서 정보를 포함합니다. 이산형 데이터는 셀 수 있는 속성을, 연속형 데이터는 실수로 표현되는 속성을 나타냅니다. […]

데이터종류 ?

[QA] QA > 모델링 > 통계모델  ARTICLE CONTENTS 데이터종류 0:11 Play Video Data type Print 척도에 따른 데이터종류 질적데이터는 수치가 아닌 기호로 표현된 데이터입니다. 질적데이터는 명목척도와 순서척도로 구한 데이터입니다. 양적데이터는 수치로 표현된 데이터입니다. 양적데이터는 간격척도와 비례척도로 구한 데이터입니다. 질적데이터 질적데이터는 수치로 표현되지 않은 데이터(관측값)입니다. 질적데이터는 명목척도와 순서척도를 사용하여 구한 데이터입니다. 질적데이터는 수치가 아닌 기호로 표현됩니다. 질적데이터는 […]

중심극한정리 ?

[QA] QA > 모델링 > 통계모델  ARTICLE CONTENTS 표본크기가 커질수록 표본평균은 모평균에 수렴 0:25 모집단(population)이 정규분포일 때 표본크기의 변화에 따른 표본평균 표집의 확률밀도함수 0:03 두 딸기품종 당도의 확률밀도함수(probability density function)와 표본의 당도평균 표집의 분포( probability density function of sampling distribution) 0:08 Play Video Central limit theorem Print 중심극한정리 확률변수, $X_1, X_2, cdots, X_n$가 서로 독립하며 […]

사분위표 ?

[QA] QA > 모델링 > 통계모델  ARTICLE CONTENTS 사분위표 0:25 Play Video Quartile table Print 사분위표 사분위표는 데이터의 분포를 표현하는 한 방법입니다. 사분위표는 데이터를 순서대로 늘어놓고 같은 개수를 가지는 4개의 집단(group)으로 나누어 놓은 표입니다. 사분위수는 이 4개의 집단의 최대값입니다. 유사하게 백분위표는 데이터를 순서대로 늘어놓고 같은 개수를 가지는 100개의 집단으로 나누어  놓은 표입니다. 이 때 100개의 집단의 […]

확률변수 ?

[QA] QA > 모델링 > 통계모델  ARTICLE CONTENTS 동전과 확률변수 0:10 12면체 주사위와 확률변수 0:10 표적과 이산형 확률변수 0:05 표적과 연속형 확률변수 0:05 Play Video Random variable Print 확률변수의 예 확률변수의 이름을 “로또복권의 등수”라 한다면 확률변수값은 1등, 2등, 3등, 4등, 5등 그리고 꽝으로 총 6개가 있을 수 있습니다.  여기서 “로또복권의 등수”는 범주형 확률변수입니다. 그리고 6개의 […]

변동계수 ?

[QA] QA > 모델링 > 통계모델  ARTICLE CONTENTS 변동계수 0:18 Play Video Coefficient of variation Print 변동계수 변동계수(변이계수, variation coefficient)는 집단의 평균에 대한 표준편차의 비입니다. 변동계수는 한 확률변수가 나타내는 확률분포의 표준편차를 평균으로 나눈 것이라고 할 수 있습니다. 변동계수는 단위가 없기 때문에 단위가 다른 속성을 비교하는 경우 유용합니다. 변동계수는 표준편차와 평균간의 계수입니다. 변동계수의 정의식에서 분모인 평균은 […]

표준오차 ?

[QA] QA > 모델링 > 통계모델  ARTICLE CONTENTS 표본크기가 1에서 100까지 표본평균의 분포 변화 (모집단 : 표준정규분포) 0:03 두 표본의 표본평균 분포 : 중심극한정리 0:07 Play Video Standard error Print 차이, 편차, 오차, 잔차 차이 차이(difference)는 두 값의 간격입니다. 두 값이 같으면 차이는 0입니다. 기준이 없습니다. 0과 양수로 표현됩니다. 편차 편차(deviation)는 값에서 기준값을 뺸 값입니다. […]