QA : 5
DATA SCIENCE : 26
TABLE : 6
TERM : 3
eISSN 2280-2211

[ DATA SCIENCE ]

좌표계

[Q&A]

ARTICLE CONTENTS

Coordinate system

Abstract

1차원 좌표계에서는 변수 값을 점으로 나타내며, 기준점에서의 거리와 방향으로 좌표를 정의합니다. 도수분포도는 데이터를 시각화할 때 유용하며, 이산형 변수는 간격을, 연속형 변수는 구간을 두어 빈도를 막대그래프로 표현합니다. 간격척도와 비례척도는 1차원 좌표계에 적용되며, 간격척도는 상태의 기준점을, 비례척도는 존재의 부재를 의미하는 0점을 갖습니다. 2차원 직교좌표계는 두 변수를 나타내며, 산점도는 개체의 속성을 시각화합니다. 2차원 극좌표계는 원점에서의 거리와 각도로 좌표를 정의합니다. 3차원 좌표계는 세 변수를 직교축으로 표현하며, 원통좌표계와 복소 3차원 공간도 사용됩니다.

Key Word

좌표계, 좌표축, 개체속성, 데이터시각화

1차원 직선좌표계와 도수분포도

변수의 변수값을 시각적으로 표현할 때 1차원 좌표계(1 dimensional coordinate system)에 점(point)으로 표시합니다. 1차원 좌표계에서 한 점의 좌표는 기준(origin)에서의 거리와 방향으로 정해집니다. 기준이 0인 경우 양수는 값이 증가하는 방향이 되고 음수는 양이 감소하는 방향을 나타냅니다. 반대로 한 점은 한 좌표값으로 표현할 수 있습니다. 즉, 1차원 직선좌표계의 한점은 한개의 변수값을 나타냅니다.

1차원 직선좌표계와 도수분포도

변수의 변수값(데이터)을 시각적으로 표현할 때 1차원(직선)좌표계를 사용할 수 있습니다. 그런데 데이터가 많으면 점이 겹쳐서 표현되므로 시각적으로 분명하게 분포를 표현하는 데 한계가 있습니다. 이 경우, 이산형 변수는 간격을 두고 연속형 변수는 구간을 두어 그 변수값이나 변수값이 속한 구간의 빈도수를 직교축에 막대그래프로 표현합니다. 이를 도수분포도라고 하며 연속형 변수의 경우 히스토그램으로 표현하기도 합니다. 

1차원 직선좌표계와 척도

척도는 관측대상인 개체의 속성을 좌표계에 나타내는 방법을 정의합니다. 예를 들어, 1m의 물리적 거리가 좌표계에서 1단위로 표현될 수 있습니다. 이 척도는 좌표계의 각 점이 실제 거리를 어떻게 나타내는지 결정합니다. 척도는 좌표계 전체에 걸쳐 일관되게 적용되어야 합니다. 1차원 좌표계에서 척도는 다음과 같은 역할을 가집니다.

– 위치의 정의 : 1차원 좌표계에서 각 점의 위치는 척도에 따라 정의됩니다. 예를 들어, 척도가 1m당 1단위라면, 좌표계의 5단위는 실제의 5m를 나타냅니다.

– 실제 거리 측정 : 1차원 좌표계에서 두 점 사이의 거리는 그들의 좌표 차이를 통해 측정될 수 있습니다. 이 거리는 척도를 통하여여 실제 물리적 거리로 변환될 수 있습니다.

1차원 직선좌표계에 적용되는 척도유형

– 명목척도는 1차원 좌표계에 일반적으로 적용되지 않습니다. 수학적 연산이 의미가 없습니다.

– 순서척도(순위척도)는 1차원 좌표계에 일반적으로 적용되지 않습니다. 수학적 연산이 제한적입니다.

– 간격척도(등간척도)는 1차원 좌표계에 적용됩니다. 간격척도가 적용된 1차원 좌표계의 0점은 위치나 상태의 주어진 기준을 의미합니다. 예를 들어, 섭씨온도는 온도차를 나타내는 데 사용되며 0점은 물이 어는 상태를 의미합니다. 측정된 간격은 수학적 연산이 가능합니다.

– 비례척도(비율척도)는 1차원 좌표계에 적용됩니다. 비례척도가 적용된 1차원 좌표계의 0점은 존재가 없음이나 양(크기)가 없음을 의미합니다. 예를 들어, 캘빈온도는 실제 분자의 운동상태를 표현하는 데 사용되며 0점은 분자의 운동이 없는 상태를 의미합니다. 측정된 비율은 수학적 연산과 비교 분석이 가능합니다.

– 위치의 정의 : 1차원 좌표계에서 각 점의 위치는 척도에 따라 정의됩니다. 예를 들어, 척도가 1m당 1단위라면, 좌표계의 5단위는 실제의 5m를 나타냅니다.

– 실제 거리 측정 : 1차원 좌표계에서 두 점 사이의 거리는 그들의 좌표 차이를 통해 측정될 수 있습니다. 이 거리는 척도를 통하여여 실제 물리적 거리로 변환될 수 있습니다.

2차원 좌표계

두 변수를 가지는 개체(요소, 객체, object, element)를 시각화 할 때, 2차원 좌표계를 사용할 수 있습니다. 2차원 좌표계에는 대표적으로 직교좌표계(Cartesian coordinate system, Descartes coordinate system)와 극좌표계(원형좌표계, polar coordinate system)가 있습니다. 

2차원 직교 좌표계

2차원 직교좌표계의 두 좌표축(axis)은 직각으로 위치하며 두 좌표축은 서로 영향을 주지 않는 독립을 나타냅니다.

개체의 표현

변수값의 속성이 범주형이 아니라 이산형이나 연속형과 같은 수치를 나타내는 경우, 이때의 변수값을 변량(variate)이라고 합니다. 변량은 간격척도나 비례척도가 적용된 관측도구로 측정되어 양적 데이터가 됩니다. 변량은 수치로 실현되는 변수값을 의미합니다. 따라서, 변량은 좌표계에서 점으로 표현할 수 있습니다. 

2차원 직표좌표계에 위치한 한 점은 두 좌표값으로 표현할 수 있습니다. 2차원 직교좌표계의 한 점은 좌표축(coordinate axes)에 투영할 수 있습니다. 이때 투영한 점이 좌표축의 좌표(coordinates)가 됩니다. 그리고 0을 기준(origin)으로 양수는 값이 증가하는 방향에 있고 음수는 양이 감소하는 방향에 있습니다. 정리하면 2차원 직교좌표계에 있는 한 점은 두 개의 변수값을 가지며 특별히 변수값의 속성이 수치인 경우, 두 변량을 가집니다.

예를 들어 딸기를 범주명으로 본다면 그 범주에 포함되는 개체를 딸기ID로 구분할 수 있습니다. 딸기 개체는 당도와 과중이라는 속성을 가지고 그 속성을 변수(variable)로 모델링할 수 있습니다. 이때 딸기 개체를 점(point)으로 생각한다면 딸기의 속성인 당도와 과중을 두 축으로 하는 2차원 직교좌표계를 사용하여 딸기 개체를 점으로 표현할 수 있습니다. 

집단의 표현

개체를 개체의 속성이 만드는 공간의 점으로 모델링하여 개체가 모인 집단을 산점도로 집단을 시각화할 수 있습니다. 예를 들어 딸기 집단을 딸기의 속성인 과중과 당도가 만드는 2차원 직각좌표계에서 점의 집합으로 표현할 수 있으며 이를 2차원 산점도라고 합니다.

1개의 독립변수와 종속변수의 관계를 나타내는 함수(function)를 표현할 때, 함수는 총 2개의 변수로 표현되므로 2차원 직교좌표계를 사용하여 시각화 할 수 있습니다. 함수를 서로 직교하는 좌표축에서 표현할 때, 연속형 함수는 연속적으로 이어진 점들의 집합으로 그려집니다.

2차원 극좌표계

2차원 극좌표계는 원점(origin)에서의 거리(radius)와 거리를 나타내는 방향(radial direction)과 그 방향의 기준이 되는 극축(polar axis)과의 각도가 좌표입니다. 여기서, 극축은 원점에서 시작되며 보통 가로선으로 표현합니다. 정리하면, 극좌표계는 원점의 위치와 원점의 방향이 기준이 되며 원점의 위치에서의 거리와 원점의 방향(극축)과의 각도가 좌표가 됩니다. 2차원 극좌표계에서는 원점에서의 거리와 극축에서의  각도 1개를 좌표로 가집니다. 참고로 3차원 극좌표계에서는 각도가 2개의 좌표로 구성됩니다. 극좌표계에서는 직교좌표계와 마찬가지로 좌표는 서로 영향을 주지 않는 독립입니다.

개체의 표현

변수값의 속성이 범주형이 아니라 이산형이나 연속형과 같은 수치를 나타내는 경우, 이때의 변수값을 변량(variate)이라고 합니다. 변량은 간격척도나 비례척도가 적용된 관측도구로 측정되어 양적 데이터가 됩니다. 변량은 수치로 실현되는 변수값을 의미합니다. 따라서, 변량은 좌표계에서 점으로 표현할 수 있습니다. 

2차원 극좌표계에 위치한 한 점은 두 좌표값인 거리와 각도로 표현할 수 있습니다. 2차원 극좌표계의 한 점은 원점에서의 방향과 거리로 표현한다고 할 수 있고 모두 양수입니다. 는 데 특히, 점들의 집합을 이루는 점들의 원점과의 거리들은 집합의 퍼짐을 나타내는 측도(measure)로 사용할 수 있습니다. 원점을 0으로 한다면 거리는 항상 양수이고 각도는 회전방향에 따라 양수 또는 음수로 표현되며 0($0$rad)과 1회전($2\pi$rad) 사이의 수치로 계량화합니다. 

예를 들어 딸기를 범주명으로 본다면 그 범주에 포함되는 개체를 딸기ID로 구분할 수 있습니다. 딸기 개체는 당도와 과중이라는 속성을 가지고 그 속성을 변수(variable)로 모델링할 수 있습니다. 이때 딸기 개체를 점(point)으로 생각한다면 딸기의 속성인 당도의 제곱과 과중의 제곱의 합의 제곱근은 원점에서의 거리이고 이 거리는 의미가 있을 수 있습니다. 한편 딸기 개체의 두 속성을 당도와 출하월이라 한다면 당도는 항상 양수이므로 원점에서의 거리($r$)로 모델링하고 출하월은 1년이라는 주기성을 가지므로 각도($\theta$)로 모델링한다면 극좌표로 표현할 수 있습니다.

$$\text{딸기ID}=(r, \theta)$$

여기서, $r$은 당도

$\theta$는 출하월

집단의 표현

개체를 개체의 속성이 만드는 공간의 점으로 모델링하여 개체가 모인 집단을 산점도로 집단을 시각화할 수 있습니다. 예를 들어 딸기 집단을 딸기의 속성인 과중과 출하월이 만드는 2차원 극좌표계에서 점의 집합으로 표현할 수 있으며 이를 2차원 산점도라고 합니다.

극좌표계에서 원을 나타내는 함수의 표현

원의 중심이 원점인 ($0. 0$)에 있고 반지름이 $r$인 원의 경우, 극좌표계에서의 표현식은 다음과 같습니다. 모든 점에서 원점에서의 거리가 일정함을 표현하고 있습니다.

$$\rho=r$$

여기서, $\rho$는 원점으로부터의 거리

$r$은 원의 반지름

원의 중심이 극좌표계에서 ($r_0,\theta_0$)에 위치하고 반지름이 $r$인 경우, 원의 방정식은 다음과 같이 나타낼 수 있습니다.

$$\rho^2 – 2r_0\rho\cos(\theta – \theta_0) + r_0^2 = r^2$$

여기서, $\rho$는 원점으로부터의 거리

$r$은 원의 반지름

($r_0,\theta_0$)는 원의 중심

3차원 직교좌표계

세 변수를 가지는 요소(element, 객체, object)를 시각화 할 때, 3차원(공간)좌표계를 많이 사용합니다. 3차원(공간)좌표계에는 대표적으로 차원(three dimensions) 직교좌표계(Cartesian coordinate system)가 있습니다. 여기서 세 좌표축(axis)은 직각을 이루어서 서로 영향을 주지 않습니다.

예를 들어 위의 애니메이션에서 보는 바와 같이 딸기를 요소라 하면 딸기의 당도와 과중과 출하일은 변수가 됩니다. 이때 딸기를 점(point)로 생각한다면 당도와 과중과 출하일을 세 축으로 하는 3차원 직교좌표계를 사용하여 산점도를 그릴 수 있습니다.

다른 관점으로 공간에서의 한 점(point)을 표현하는 방법에는 대표적으로 직교좌표계(Cartesian coordinate system)가 있습니다. 세개의 선이 직각(perpendicular)으로 교차하는 좌표축(coordinate axis)을 가집니다.  공간의 한 점은 기준(Origin)에서의 거리를 좌표로 합니다. 그리고 그 거리는 같은 단위를 가집니다. 따라서 공간의 한 점은 세개의 좌표값으로 표현할 수 있습니다. 즉, 공간의 한점은 세개의 좌표의 변수값을 가집니다. 

공간좌표는 세개의 변수들의 관계를 나타내고 있기 때문에 3차원(three dimensions) 좌교계라고도 합니다. 한편, 평면좌표는 두개의 변수들의 관계를 나타내고 있기 때문에 2차원(two dimensions)좌표계라고 합니다.

3차원 원통좌표계

한 개체에서의 속성으로 두 원인변수와 확률밀도, 세가지를 가질 때, 원통좌표계(cylindrical coordinate system)를 많이 사용합니다. 

복소 3차원공간

복소3차원공간(complex 3D space)은 복소평면을 포함하는 3차원 좌표계입니다. 이 좌표계에서는 하나의 축이 실수부를, 다른 하나의 축이 허수부를 나타내며, 세 번째 축은 추가적인 차원(예를 들어, 물리적 공간의 한 차원 또는 다른 수학적 차원)을 나타내는 데 사용합니다.

Terminology

산점도

산점도(산포도)는 일반적으로 여러 변수를 가지는 개체를 표시하기 위해 직각 좌표계를 사용하는 그래프 유형입니다. 점이 시각적으로 정의된 경우 (색상 / 모양 / 크기) 하나의 추가 변수로 표시 될 수 있습니다. 3차원 산점도에서 데이터는 수평 축상의 위치를 결정하는 하나의 변수 값과 수직축 상의 위치를 결정하는 다른 변수의 값을 갖는 점들의 모음으로 표시됩니다.

출처

Scatter plot – Wikipedia

Reference

  1.  

박근철, 양윤원

DocuHut Co. Ltd., Seoul, Republic of Korea

Park GC, Yang YW.

Data Type.

Data Science 2024;1:1.

Received: 31 March 2023,

Revised: 30 April 2023,

Accepted: 04 May 2023,

Published: 19 May 2023

DOI : 24711

데이터사이언스, Vol, Issue, 

Print