Scatter plot (2dimension)
산점도 (2차원)
20개의 딸기, 각각의 과중과 당도를 측정한 데이터가 있습니다.
즉, 딸기 하나에 과중과 당도라는 이름을 가지는 두개의 변수가 있습니다.
그런데 딸기의 과중과 당도의 관계가 궁금합니다.
그래서 두 변수의 관계를 시각화하는 산점도(scatter plot)를 그려 봅니다.
딸기 하나를 산점도의 한 점(point)로 생각하는 것이 첫번째 해야할 결정입니다.
그럼 딸기가 20개이므로 20개의 점을 평면좌표에 찍으면 되겠습니다.
두번째 해야할 결정은 원인 될 만한 변수를 X축에 놓고 결과를 Y축에 놓는 것입니다.
따라서 과중과 당도를 각각 X축과 Y축에 나타냅니다.
산점도를 보면 과중이 클 수록 당도가 높게 나옵니다.
무거운 딸기, 즉 큰 딸기가 달다고 해석할 수 있겠습니다.
또한 20개 딸기의 출하일과 당도를 기록한 데이터가 있습니다.
마찬가지로 산점도를 보면 출하일이 겨울일 때 달다는 것을 알 수 있습니다.
산점도(scatter plot)을 일반적으로 설명해 보겠습니다.
산점도는 데이터의 요소가 가지는 두 변수의 상관 관계를 분석하는 그래프입니다.
특히, 두 연속형 변수의 관계를 분석하는데 매우 효율적입니다.
요소(element)의 한 변수를 X축, 다른 변수를 Y축으로 하여 각각의 관찰값을 XY 평면상의 점으로 나타내는 2차원그래프입니다.
두 개의 변수에서 한쪽이 증가하면 다른 쪽도 증가하는 관계를 양의 상관이라고 합니다.
반대로 한쪽이 증가하면 다른 쪽은 줄어드는 관계를 음의 상관이라고 합니다.