혼합선형모델에서 랜덤효과는 회귀식의 기울기와 절편 모두에 영향을 줄 수 있나?
목차 네. 절편(intercept) 뿐만 아니라 기울기(slope)에도 영향을 줄 수 있습니다. 절편에 랜덤효과가 더해지면 각 집단의 회귀선이 평행이동합니다. : 랜덤절편모델 (Random intercept model) 기울기에 랜덤효과가 더해지면 각 집단의 회귀선이 회전합니다. : 랜덤기울기모델 (Random slope model) 절편과 기울기, 동시에 랜덤효과가 더해지면 각 집단의 회귀선의 절편과 기울기가 모두 달라집니다. : 랜덤절편기울기모델 (Random intercept and slope model) 1. 랜덤절편모델 […]
고정효과 선형모델에서 독립변수는 확률변수인가?
목차 네. 독립변수가 무작위로 관측되면 독립변수를 확률변수로 봅니다. 반면, 독립변수를 고정값으로 보는 경우는 독립변수를 연구자가 정할 때입니다. 예를 들어 농업실험이나 임상시험에서 실험조건을 연구자가 정하는 경우입니다. 1. 고정독립변수와 확률독립변수의 비교 고정효과 선형모델에서 독립변수를 확률변수로 두면, 현실적 데이터 구조(샘플링·상관성)를 더 잘 반영하고, 특히 일반화 가능성과 예측력이 향상됩니다. 따라서 확률독립변수(Random-X)는 관측 데이터 분석에 더 자연스럽습니다. 반면, 고정독립변수(Fixed-X)는 독립변수를 […]
혼합선형모델에서 반응변수의 분산은 고정효과의 추정량에 영향을 주나?
목차 네 추정량에 영향을 줍니다. $$hat{boldsymbol{beta}} = left(mathbf{X}^mathsf{T} mathbf{V}^{-1} mathbf{X}right)^{-1} mathbf{X}^mathsf{T} mathbf{V}^{-1} mathbf{y}$$ 여기서, $hat{boldsymbol{beta}}$는 고정효과벡터의 추정량 $mathbf{V}$는 반응변수벡터 $mathbf{y}$의 분산-공분산행렬 혼합선형모델에서 반응변수의 분산은 고정효과벡터 추정량의 기대값 $mathrm{E}[hat{boldsymbol{beta}}]$에는 영향을 주지 않습니다. $$mathrm{E}[hat{boldsymbol{beta}}]=boldsymbol{beta}$$ 모평균은 상수이고 표본평균은 표본추출에 따라 값이 변하는 확률변수입니다. 그러나 표본평균을 관측값(상수)으로 고정하면, 모평균은 그 값을 중심으로 분포를 가지는 추정량의 형태로 해석하는 것과 같은 […]
고정효과를 추정(estimaion)한다면 랜덤효과는?
목차 예측(prediction)합니다. 혼합선형모델(LLM)에서 고정효과는 모델의 구조를 설명하는 상수이고, 랜덤효과는 각 집단의 편차를 예측한 확률변수값이며 모델을 보정합니다. 혼합선형모델에서 고정효과인 모수를 BLUE로 추정하고 랜덤효과인 확률변수값을 BLUP로 예측합니다. 혼합선형모델에서 고정효과와 랜덤효과는 함께 작동하며, 고정효과를 추정한 후 랜덤효과를 예측하여 전체 모델이 완성됩니다. 1. 고정효과 선형모델 고정효과(fixed effects) 선형모델(linear model)은 모든 효과를 고정된 상수(모수)로 간주하여 구성된 선형모델입니다. 이 모델은 집단 […]
순서형 변수의 수준과 계층구조의 수준은 같은 것?
목차 순서형 변수의 수준(level)과 계층구조의 수준(level)은 개념적으로 다릅니다. 1. 순서형 변수에서의 수준(level) 순서형 변수의 변수값인 범주명을 수준(level)이라고 부릅니다. 순서형 변수인 “교육수준”의 변수값(수준, level)은 다음과 같습니다. 고졸, 대졸, 대학원졸 순서형 변수에서의 수준의 특징은 다음과 같습니다. 1. 순서 존재: 수준 간에는 명확한 서열(순서)이 존재 예: 고졸 < 대졸 < 대학원졸 2. 간격 불균등: 수준 간 간격은 동일하다고 가정할 수 […]
집단에서의 개체는 전체집단에서는 무엇?
목차 집단입니다. 계층구조에서는 집단도 하나의 개체처럼 취급합니다. 계층구조에서는 전체 변동성을 서로 다른 계층(hierarchy, 수준, level)에서의 변동성으로 분해해서 봅니다. 이를 분산의 계층적 분해 (hierarchical variance decomposition) 라고 합니다. 등분산가정 2계층 모델 $$Y_{ij}=mu+u_j+epsilon_{ij}$$ 여기서, $ Y_{ij}$는 $j$번째 집단에 속한 $i$번째 개체의 관측값 $mu$는 전체평균 $u_j$는 $j$번째 집단의 오차: $u_j sim mathcal{N}(0, sigma_u^2)$ (등분산가정) $epsilon_{ij}$는 $j$번째 집단의 $i$번째 […]
평균없는 분산이 있을 수 있나?
목차 없습니다. 분산은 평균이라는 기준이 있어야 정의되는 퍼짐의 정도입니다. 특별히, 평균이 상수값이고 분산이 0인 경우는 축소분포(degenerate distribution)입니다. 이산형일 때, 축소분포는 사건의 확률로 표현합니다 $$P(X=c)=1$$ 연속형일 때, 축소분포는 Dirac delta 함수로 표현합니다. $$delta(x – c)$$ 또한, 평균이 0이고 분산이 무한대인 경우는 자유도가 $1 < nu leq 2$인 t분포입니다. 자유도가 1인 t분포는 Cauchy분포라고도 합니다. 1. 집단의 평균과 […]
정수, 유리수, 무리수, 실수 중에서 연속인 수체계는?
목차 실수입니다. 연속성의 필요성: 연속성이 보장된 실수 함수 위에서만 미분과 적분이 성립됩니다. 시간, 거리, 온도 등의 연속적인 양은 실수로 표현되어야 합니다. 극값을 정의하고 분석하기 위해서는 함수가 연속적이어야 하며, 이러한 연속성은 실수 공간에서 보장됩니다. 1. 수체계 수체계(Number System)는 수학적 연산과 논리 체계 내에서 수의 집합들을 공리적으로 정의하고, 그 위상 및 대수적 구조에 따라 분류한 계층적 구조입니다. […]
정규분포를 따르는 확률변수의 벡터가 생성하는 표현공간에서의 결합확률분포는 무엇?
목차 다변량 정규분포(multivariate normal distribution)입니다. 변량은 확률변수의 실제 관측값을 의미합니다. 어떤 확률공간 $(Omega, mathcal{F}, P)$ 위에 정의된 정규분포 확률변수 벡터 $ mathbf{X} = (X_1, ldots, X_n)^top $가 있을 때, 그 벡터가 표현공간 $ mathbb{R}^n $에서 따르는 결합확률분포 $ P_{mathbf{X}} $는 다변량 정규분포 $mathcal{N}(boldsymbol{mu}, boldsymbol{Sigma})$입니다. 확률변수는 항상 어떤 확률공간 ($Omega$, $mathcal{F}$, $P$) 상에 정의됩니다. 정규분포를 나타내는 […]
다변량 정규분포는 여러 개의 정규분포를 합친 것인가?
목차 아니요, 변량(확률변수값) 간의 상관이 있어야 합니다. 다변량 정규분포는 정규성과 상관이 있는 확률변수들을 원소로 하는 벡터의 확률분포입니다. 개체의 속성이 정규분포를 나타내고 개체의 속성이 서로 상관을 가질 때 개체가 이루는 집단의 속성의 분포는 확률변수 벡터로 표현되며 그 벡터는 다변량 정규분포를 나타냅니다. 다변량 정규분포를 나타내는 대표적인 확률변수 벡터로는 집단의 육종가 벡터가 있습니다. [mathbf{a} = begin{pmatrix}a_1 \a_2 \vdots […]