확률변수 Random variable








확률변수(Random variable)는 말 그대로 확률을 가지는 변수입니다. 변수이기 때문에 어떤 값을 가질지는 모르지만 변수값에 따라 나올 가능성, 즉 확률(Probability)이 정해져 있는 변수를 확률변수라고 합니다. 예를 들어 로또복권은 등수에 따라서 각각 다른 확률을 가지게 됩니다. 따라서 등수는 확률변수가 됩니다. 확률변수를 표현하려면 확률변수명을 정하고 확률변수값에 대한 정의를 내리면 됩니다. 물론 확률도 알면 확률변수값에 대응하여 표현하면 됩니다.

 

확률변수의 이름을 “로또복권의 등수”라 한다면, 로또복권의 등수의 확률변수값을 나열하면, 1등, 2등, 3등, 4등, 5등 그리고 꽝인 6개입니다.  여기서 “로또복권의 등수”는 범주형 확률변수입니다. 그리고 6개의 확률변수값으로 구성됩니다. 로또복권의 한 회차의 판매를 마감하면 각 등수에 대한 확률도 규정된 수식에 의해 계산될 수 있습니다.

 

더 간단한 예는 동전던지기입니다. 0과 1을 써 놓은 동전은 확률변수값으로 0과 1 두 개를 가지게 됩니다. 그리고 완벽하게 두 면이 대칭된 동전이라면 동전던지기에서 나오는 윗면을 확률변수명으로 하는 확률변수의 확률변수값,  0, 1의 확률은 각각 1/2로 같습니다. 여기서 확률(Probability)이 있다는 것은 사건(Event)이 있다는 것을 전제합니다. 즉, 동전을 던져서  윗면의 숫자를 관측한다는 실제적인 시행(Trial)을 해야 시행의 결과인 사건(Event)이 나타납니다. 여기서 사건은 0과 1 두가지가 있습니다.

 

12면 주사위는 확률변수값이 12개입니다. 여기서도 주사위를 던진다는 시행(Trial)이 전제되어야 사건(Event)이 발생하고 확률이 존재합니다. 한편,  궁수가 과녁에 화살을 쏘는 행위를 할 때 확률변수는 과녁의 나누어진 면적이 될 수도 있고 과녁이 없을 때는 중심에서 떨어진 거리가 될 수가 있습니다.

 

그렇다면 궁수의 실력은 어떻게 나타낼 수 있을까요. 궁수가 활을 쏜 후 관측된 확률변수값이 되겠습니다. 이렇게 관측된 확률변수값을 데이터라고 합니다. 궁수의  데이터가 많을 수록 궁수의 실력을 보다 정확히 말할 수 있겠습니다. 궁수의 실력을 나타내는 확률분포는 궁수가 많이 쏠수록 궁수의 실력을 더 잘 반영할 것입니다. 그렇지만, 데이터가 충분히 많고 그 데이터가 좋게 나온 궁수가 활쏘기 대회에서 우승한다고 단언할 수 는 없습니다. 확률이 높다고만 할 수 있고  예측만 가능하다는 것입니다.

 

확률변수(Random Variable,  Stochastic Variable, 確率變數)를 나타내는 기호로는 알파벳 대문자를 사용합니다.

X

 

확률변수의 값(Value of random variable)은 확률변수에서 사용한 알파벳의 소문자를 사용하면 구분자는 아래첨자를 사용하기도 합니다.

x1, x2, x3, …

 

확률변수는 다음과 같이 설명할 수도 있습니다.

확률을 가지는 변수

시행(Trial)을 해서 어떤 사건이 나타났는지 보면  값이 정해지는 변수

시행을 많이 해서 평균을 구하면 어떤 값, 즉 기대값에 수렴하는 변수

 

특별히 범주형 확률변수의 예를 들면 다음이 같은 것들이 있습니다.

 

동전의 확률변수값 : 앞면, 뒷면

6면 주사위의 확률변수값 : 1면,2면,3면,4면,5면,6면

12면 주사위의 확률변수값  : 1면,2면,3면,4면,5면,6면,7면,8면,9면,10면,11면,12면

과녁의 확률변수명 : 노랑, 빨강, 파랑, 검정

 

시행(Trial)의 결과를 사건(Event)이라하고 시행의 결과는 확률변수와 대응될 수 있습니다. 시행의 결과(Sample)가 시행공간(Sample space)안에 항상 존재한다면 그 변수는 확률을 가질 수 있는 변수, 즉 확률변수(Random variable)입니다. 확률변수가 가지는 확률값의 합은 1이거나 100%입니다.

 

확률변수의 예와 관측에 사용되는 척도를 살펴보면 동전던지기라는 시행으로 생성된 시행공간은 동전의 앞면과 뒷면입니다. 이 시행공간을 확률변수로 대응한다면 범주형 확률변수입니다. 그리고 척도로는 명목척도가 사용됩니다. 주사위도 마찬가지로 6면을 1에서 6까의 숫자로 표시하였을 때 주사위 던지기라는 시행에서 시행공간은 1, 2, 3, 4, 5, 6의 숫자이며 이는 바로 확률변수값이 됩니다. 그리고 이 확률변수는 수치형중에서 연속형이 아닌 이산형 확률변수입니다. 그리고 척도로는 수식계산이 가능한 간격척도가 사용됩니다.

강의와 실습

아래의 구글시트 실습하기를 눌러서, 본인의 구글 계정으로 구글시트를 복사하신 후, 실습하실 수 있습니다. 실습 과정은 AI 강의로 보실 수 있습니다.



구글시트 실습하기

구글시트는 별도의 설치 과정없이 크롬(Chrome)에서 바로 사용하실 수 있습니다.