OPEN ACCESS JOURNAL

Peer Reviewed
eISSN

데이터가 생성될 확률분포를 규정하는 값이 모수인가?

목차 https://www.datadata.link/wp-content/uploads/2025/10/MOVIE-최대우도법-모수.mp4 네, 그렇습니다. $$Y sim f(ymid theta)$$ 여기서, $Y$는 확률변수 $f(cdot)$은 확률분포함수(확률밀도함수 또는 확률질량함수) $y$는 생성된 데이터 $theta$는 모수 모수는 확률분포를 결정하는 값이고, 그 확률분포로 부터 실제로 데이터가 생성됩니다. 즉, 모수가 정해지면 데이터의 구조인 분포의 모양과 위치, 퍼짐 정도 등이 완전히 결정됩니다. 모수는 확률분포의 매개변수(parameter)입니다. $$Y sim f(y;theta)$$ 1. 모수 모수(母數. parameter)는 확률분포를 매개로 […]

우도함수의 종속변수는 우도이고 독립변수는 모수인가?

목차 https://www.datadata.link/wp-content/uploads/2025/10/MOVIE-우도함수-챕터1.mp4 네, 그렇습니다. 수학적 함수 관점에서는 우도함수의 종속변수는 우도이고 독립변수는 모수입니다. 확률분포함수(확률밀도함수 또는 확률질량함수)의 독립변수를 관측된 데이터로 고정하고 매개변수인 모수를 독립변수로 취급하는 함수가 우도함수입니다. 무엇보다 중요한 점은 우도함수는 함수값으로 확률을 나타내는 것이 아니라 우도를 나타낸다는 것입니다. 우도는 확률이 아니라 주어진 데이터에서의 모수의 그럴듯함의 정도라고 할 수 있습니다. 확률변수가 데이터로 실현되면 우도도 우도값으로 수치화할 수 […]

관측대상이 변동성(variability)을 가져야만 관측값에서 변동(variation)이 나타나나?

목차 https://www.datadata.link/wp-content/uploads/2025/09/MOVIE-변동성-1.mp4 네, 확률변수 또는 집단이 변동성을 가져야 합니다. 변동성은 확률변수나 집단이 가지는 퍼짐의 정도이고, 분산 같은 통계량으로 수치화됩니다. 확률변수의 대표적인 변동성 척도는 분산입니다. 집단의 대표적인 변동성 척도는 총제곱합(total sum of squares)입니다. 집단의 총제곱합을 집단크기(또는 자유도)로 표준화한 것이 분산(variance)입니다. 1. 확률론 관점에서의 변동성: 관측대상은 확률변수 확률론적 측면에서 변동성은 확률변수 $Y$의 분산으로 정의됩니다. 이는 확률변수가 본래 […]

표본평균의 표준오차는 모집단의 표준편차와 표본의 크기와 관계있나?

목차 https://www.datadata.link/wp-content/uploads/2025/09/MOVIE-표준편차와-표준오차-V1.0.mp4 네, 표본크기의 제곱근과 관계있습니다. $$sigma_{bar{X}}=dfrac{sigma_{X}}{sqrt{n}}$$ 여기서, $dfrac{1}{sqrt{n}}$은 상쇄비율 $n$은 표본크기 모집단의 표준편차가 클수록 표본평균의 표준오차도 커지지만 표본크기가 클수록 표본평균의 표준오차는 작아집니다. 즉, 두 요인이 곱해져서 표본평균의 표준오차가 결정됩니다. 모집단의 분산 $sigma_{X}^2$과 표본평균의 분산 $sigma_{bar{X}}^2$의 비는 표본크기 $n$입니다. $$sigma_{bar{X}}^2=dfrac{sigma_{X}^2}{n}$$ 모집단에서 랜덤추출하는 표본의 변동성은 개체의 변동성에 기인합니다. 표본크기가 커질수록 개체간 변동성은 서로 상쇄되기 때문에 표본의 […]

선형모형을 이용한 SNP 마커 효과 분석 : ANOVA 모형을 이용한 마커의 평균 효과 추정

Figure Animation 데이터의 정규성에 대한 시각적 판정 Pairwise scatter plots for Hanwoo tenderness and intramuscular fat in different muscle parts (D: longissimus dorsi, S: semimembranosus) with linear regression lines Fig. 3. 한우 등심 지방함량과 전단력간 회귀분석 및 회귀계수의 유의성 Fig. 4. 한우 설도 지방함량과 전단력간 회귀분석 및 회귀계수의 유의성 데이터의 정규성에 대한 시각적 판정 Pairwise […]

랜덤효과 ANOVA에서 예측한 집단평균은 표본내 집단평균과 일치하나?

목차 아니오. 랜덤효과 ANOVA에서 예측한 집단평균은 표본내 집단평균과 일치하지 않습니다. 고정효과 ANOVA에서는 추정된 집단평균이 표본내에서의 집단평균입니다. 랜덤효과 ANOVA에서는 집단평균 효과는 BLUP(최적 선형 예측치)으로 예측되며, 표본내 집단평균보다 전체평균 쪽으로 수축(shrinkage) 됩니다. 특히 표본 수가 적거나 집단 내 분산이 큰 경우, 표본내 집단평균보다 전체평균에 더 가깝게 조정됩니다. 랜덤효과에서는 예측한 집단평균이 모집단을 반영하므로 표본내에서만의 집단평균과는 차이가 있을 수 […]

딸기의 상품가치 예측모델 모의실험형 데이터셋 생성

목차 요약영상 3 Videos 데이터 준비중 0:03 모델링 준비중 0:03 데이터분석 준비중 0:03 저자정보 출판이력 DOI 인용 다운로드 Print 구글문서 Print 구글문서 요약 데이터사이언스 분야는 빠르게 발전하고 있으며, 고품질 데이터셋은 학습과 연구에 필수적이다. 그러나 실제 데이터 수집은 비용과 접근성에서 제약이 크다. 이를 해결하고 효과적인 교육을 위해, 딸기의 상품 가치를 나타내는 합성 데이터셋을 생성하였다. 이 데이터셋은 […]

혼합선형모델에서 랜덤효과는 회귀식의 기울기와 절편 모두에 영향을 줄 수 있나?

목차 네. 절편(intercept) 뿐만 아니라 기울기(slope)에도 영향을 줄 수 있습니다. 절편에 랜덤효과가 더해지면 각 집단의 회귀선이 평행이동합니다. : 랜덤절편모델 (Random intercept model) 기울기에 랜덤효과가 더해지면 각 집단의 회귀선이 회전합니다. : 랜덤기울기모델 (Random slope model) 절편과 기울기, 동시에 랜덤효과가 더해지면 각 집단의 회귀선의 절편과 기울기가 모두 달라집니다. : 랜덤절편기울기모델 (Random intercept and slope model) 1. 랜덤절편모델 […]

고정효과 선형모델에서 독립변수는 확률변수인가?

목차 네. 독립변수가 무작위로 관측되면 독립변수를 확률변수로 봅니다. 반면, 독립변수를 고정값으로 보는 경우는 독립변수를 연구자가 정할 때입니다. 예를 들어 농업실험이나 임상시험에서 실험조건을 연구자가 정하는 경우입니다. 1. 고정독립변수와 확률독립변수의 비교 고정효과 선형모델에서 독립변수를 확률변수로 두면, 현실적 데이터 구조(샘플링·상관성)를 더 잘 반영하고, 특히 일반화 가능성과 예측력이 향상됩니다. 따라서 확률독립변수(Random-X)는 관측 데이터 분석에 더 자연스럽습니다. 반면, 고정독립변수(Fixed-X)는 독립변수를 […]

혼합선형모델에서 반응변수의 분산은 고정효과의 추정량에 영향을 주나?

목차 네 추정량에 영향을 줍니다. $$hat{boldsymbol{beta}} = left(mathbf{X}^mathsf{T} mathbf{V}^{-1} mathbf{X}right)^{-1} mathbf{X}^mathsf{T} mathbf{V}^{-1} mathbf{y}$$ 여기서, $hat{boldsymbol{beta}}$는 고정효과벡터의 추정량 $mathbf{V}$는 반응변수벡터 $mathbf{y}$의 분산-공분산행렬 혼합선형모델에서 반응변수의 분산은 고정효과벡터 추정량의 기대값 $mathrm{E}[hat{boldsymbol{beta}}]$에는 영향을 주지 않습니다. $$mathrm{E}[hat{boldsymbol{beta}}]=boldsymbol{beta}$$ 모평균은 상수이고 표본평균은 표본추출에 따라 값이 변하는 확률변수입니다. 그러나 표본평균을 관측값(상수)으로 고정하면, 모평균은 그 값을 중심으로 분포를 가지는 추정량의 형태로 해석하는 것과 같은 […]