1차원 산점도 1 dimensional scatter plot



1차원 점그래프 (과중)


1차원의 연속형변수값들을 시각화하는 방법 중에 직관적인 방법은 직선좌표계에 변수값을 점으로 표시하는 것입니다. 직선좌표계의 원점(Origin)을 0으로 하면 변수값들은 원점으로부터 양방향으로 나눠지는 영역에 점으로 표시됩니다. 

 

애니메이션에서는 딸기의 당도가 모두 양수이므로 직선좌표계의 원점(0)의 오른편에 점들로 데이터가 표시되고 있습니다.

 

데이터를 산점도를 사용해서 시각화할때 점들이 중복되어 나타나는 것이 가장 큰 애로점입니다. 이것을 해결하기 위하여 여러가지 표현방법이 동원되지만 근원적인 해결은 되지 못합니다. 그래서 같이 사용되는 것이 도수분포도입니다. 한편, 데이터사이언스에서는 도수분포도가 1차원 데이터를 가지는 표본의 확률분포를 표시하는데 주로 사용됩니다. 정리하면 1차원 산점도와 도수분포도는 밀접한 관계를 가지며 도수분포도는 1차원 산점도를 변수의 구간을 정하는 조작을 통해 더 확실하게 시각화한 것입니다. 물론 구간의 간격을 정하는 과정에서 정보가 왜곡될 수 있다는 어려움이 있습니다.

 

딸기가 당도외에 또 하나의 변수를 가질 때는 2차원 산점도로 확장할 수 있습니다. 그래프로 표시한 변수를 X축 다른 변수를 Y축으로 하여 각각의 관찰값을 XY 평면좌표계의 좌표값으로 정합니다.

 

산점도를 점그래프라고도 합니다. 1차원 산점도를 확장해서 2차원 산점도를 그리려면 2차원 좌표계, 즉 평면좌표계에서 점을 찍습니다. 직각좌표계를 사용한다면 한 점당, X좌표, Y좌표 두개의 변수값이 필요합니다. 3차원좌표계,  즉 공간좌표계에서는 3개의 변수값이 필요합니다. 


강의와 실습

아래의 구글시트 실습하기를 눌러서, 본인의 구글 계정으로 구글시트를 복사하신 후, 실습하실 수 있습니다. 실습 과정은 AI 강의로 보실 수 있습니다.



구글시트 실습하기

구글시트는 별도의 설치 과정없이 크롬(Chrome)에서 바로 사용하실 수 있습니다.