변수란 무엇인가요

“동전 한개를 던져서 나오는 윗면의 값”인 확률변수


“동전 여러개를 던져서 나오는 윗면의 합의 값”인 확률변수


변수란 변하는 것입니다.

영어로는 Variable 입니다. 변하는 것에 이름을 붙인 것이 변수명입니다.

 

예를들면  500알의 딸기의 당도를 측정하면,  당도는 500개의 숫자로 이루어 집니다. 이와 같이 변하는 “당도”를 변수라고 합니다. 변수의 이름을 “딸기의 당도”로 하면 이해가 쉽겠지요. 그리고 수식에 사용하는 변수명은 x와 y등 알파벳 기호를 많이 사용합니다. 

 

1개의 동전의 양면에 각각 0과 1을 쓰고, 동전을 바닥에 던져서 위로 향한 숫자를 보면   0 혹은 1이 나오게 됩니다. 즉, “윗면의 수”를 변수로 한다면  변수가 가지는 값은 0과 1로만 구성됩니다.

 

확장해서, 동전 4개의 양면에 각각 0과 1을 쓰고, 동전을 바닥에 던져서 위로 향한 숫자를 더하면  0, 1, 2, 3, 4 다섯개 숫자 중에서 하나가  됩니다. 여기서 변수를 “동전 3개를 던져서 나타난 동전 윗면의 합”이라고 할 수 있습니다.

 

동전의 앞면과 뒷면이 나올 확률이 반반인 동전 4개를 여러번 던지다 보면, 경험을 통해 윗면의 합이  2가 나올 확률이 0이나 4가 나올 확률보다 높다는 것을 알 수 있습니다.


확률변수란 확률을 가지는 변수입니다.

“설의 당도”라는 변수는 0에서 100사이에 반드시 존재하기에 확률변수입니다.

“설”이라는 품종의 딸기 중 500개의 딸기를 표본추출해서 당도를 측정해본 결과  “설의 당도”는 9.64부터 12.96 사이에 95%가 존재하며, 이 범위를 벗어나는 것은 5%라는 결과를 얻게 되었습니다.  “설의 당도”는 확률변수이기 때문에 합해서 항상 100%가 됩니다. 

 


변수의 상대적인 개념은 상수입니다.

우리가 추출한 표본의 평균과 분산은 표본을 추출할 때마다 변하는 값, 즉 변수입니다. 반대로 표본의 모집단의 평균과 분산은 변하지 않는 상수로 가정하고 모델링을 하는 경우가 많이 있습니다.


변수와 상수의 차이, 변수와 상수의 비율도 변수입니다.

모집단의 평균과 표본평균의 차이, 모집단의 분산과 표본분산의 비율은 표본을 추출할 때마다 변하고, 확률을 가지고 설명할 수 있는 확률변수입니다.