Scatter plot (2dimension)
산점도 (2차원)

산점도(과중과 당도)


산점도(출하일과 당도)

20개의 딸기,  각각의 과중과 당도를 측정한 데이터가 있습니다.

즉,  딸기 하나에 과중과 당도라는 이름을 가지는 두개의 변수가 있습니다.

 

그런데 딸기의 과중과 당도의 관계가 궁금합니다.

그래서 두 변수의 관계를 시각화하는 산점도(scatter plot)를 그려 봅니다.

 

딸기 하나를 산점도의 한 점(point)로 생각하는 것이 첫번째 해야할 결정입니다.

그럼 딸기가 20개이므로 20개의 점을 평면좌표에 찍으면 되겠습니다.

 

두번째 해야할 결정은 원인 될 만한 변수를 X축에 놓고 결과를 Y축에 놓는 것입니다.

따라서 과중과 당도를 각각 X축과  Y축에 나타냅니다.

 

산점도를 보면 과중이 클 수록 당도가 높게 나옵니다.

무거운 딸기, 즉 큰 딸기가  달다고 해석할 수 있겠습니다.

 

또한 20개 딸기의 출하일과 당도를 기록한 데이터가 있습니다.

마찬가지로 산점도를 보면 출하일이 겨울일 때 달다는 것을 알 수 있습니다.

 

산점도(scatter plot)을 일반적으로 설명해 보겠습니다.

산점도는 데이터의 요소가 가지는 두 변수의 상관 관계를 분석하는 그래프입니다.

특히,  두 연속형 변수의 관계를 분석하는데 매우 효율적입니다.

요소(element)의 한 변수를 X축,  다른 변수를 Y축으로 하여 각각의 관찰값을  XY 평면상의 점으로 나타내는 2차원그래프입니다.

 

두 개의 변수에서 한쪽이 증가하면 다른 쪽도 증가하는 관계를 양의 상관이라고 합니다.

반대로 한쪽이 증가하면 다른 쪽은 줄어드는 관계를 음의 상관이라고 합니다.