정형데이터 Structured data



정형데이터의 요소(element)




정형데이터의 변수(variable)




정형데이터의 요소명과 변수


데이터의 종류에서 정형데이터는 비정형데이터와 달리 가로와 세로로 구성된 칸안에 들어가는 값으로 표현될 수 있는 데이터입니다. 가로줄을 행(row)이라하며 세로줄을 열(column)이라 합니다. 한편,  머신러닝에서는 “행”은 예제(example),  “열”은 속성(attribute)이라고 합니다.

 

정형데이터(data)는 계열(family)로 구성됩니다. 계열은 세로줄 “열(column)”로 표현되며 변수명(variable name)과 변수(variable)로 구성되어 있습니다. 여기서 변수를 좁은 의미의 데이터라고 합니다. 그리고 변수의 값을 변수값 또는 데이터라고 합니다.

 

한편, 데이터는 요소(element)가 모여 있는 집합입니다. 요소는 가로줄 “행”으로 표현되며 개체(object) , 기록(record)이라고도 합니다. 각 요소는 요소명(element name)과 변수(variable)로 구성됩니다. 요소의 예로 인간을 들면 각 인간은 키와 체중이라는 이름을 가지는 변수를 가지고 있습니다. 한 요소에서의 변수값들은 좁은 의미의 데이터라고도 하고 관측값, 측정값, 관찰값 등으로 불리웁니다.


실습

아래의 구글시트 실습을 누르시면, 본인의 데이터링크 계정으로 구글시트를 복사하신 후, 실습하실 수 있습니다. 실습에 대한 설명은 AI 강의로 보실 수 있습니다.

구글시트 사용법 크롬 설치

구글시트 실습

<구글시트 함수>

=SUM(B3:B22) : 합계

 

 



<실습강의 내용>

데이터