생성단위 자연상수 e

1. 애니메이션

1.1. Natural exponential    $y=e^x$

1.2. Gaussian function    $y=e^{-x^2}$


2. 설명

2.1. 생성단위 자연상수

2.2. 자연상수의 적용


3. 실습

3.1. 구글시트

3.2. 구글시트 함수

3.3. 실습강의


4. 용어와 수식

4.1. 용어


1. 애니메이션



Natural exponential    $y=e^x$




Gaussian function    $y=e^{-x^2}$


2. 설명

2.1 생성단위 자연상수 (Natural constant, $e$)

곱의 기준은 1입니다. 1은 자신을 $x$번 곱해도 자신이 됩니다. 

1x=11^x = 1

그리고 모든 수는 자신을 0번 곱하는 것을  지수의 기준 1로 정의합니다.

a0 =1a^0 = 1

자신을 $x$번 곱해서 나오는 값이 $x$에서의 자신의 미분계수인 수가 자연상수 $e$입니다. 자연상수($e=2.718\cdots$)는 무리수입니다.

 

$e$를 $x$번 곱해서 나오는 값이  $e^x$ 라면 다음식이 성립합니다.

$\dfrac{d(e^x)} {dx} = e^x$

자연상수가 밑이 되는 지수함수를 표현하면

y=exy=e^x

여기서,  $x < 0$ 이면  $y=\left(\dfrac{1}{e}\right)^{ㅣxㅣ}$

$x = 0 $ 이면  $y=e^x= 1$

$0 < x$ 이면  $y=e^x$

자연상수를 급수(series)로 표현하면

$$\eqalign{e=\sum_{n=0}^{\infty}\dfrac{1}{n!} &= \dfrac{1}{1} + \dfrac{1}{1} + \dfrac{1}{1\cdot 2} + \dfrac{1}{1\cdot 2\cdot 3} + \cdots \cr&= \dfrac{1}{0!} + \dfrac{1}{1!} + \dfrac{1}{2!} + \dfrac{1}{3!} + \cdots}$$

자연로그와의 관계는

 

lnex=x,eln(x)=x


1이 1회전동안 생성되는 값

drdt=et\dfrac{dr}{dt}=e^t

여기서,  $\dfrac{d\theta}{dt}=2\pi$

1이 1회전동안 원주를 따라 생성되는 값

dldt=2πet\dfrac{dl}{dt}=2{\pi}e^t

여기서,  $\dfrac{dl}{dt}=2{\pi}\dfrac{dr}{dt}$


2.2. 자연상수의 적용

복리 적금을 생각해봅니다. 복리 적금의 원금과 이자의 합계(원리 합계)는 다음의 식과 같이 계산할 수 있습니다.

 

원리합계 = 원금 × (1 + 이자율)기간

 

원리합계는 원금과 이자율과 기간이 결정한다는 것을 알 수 있습니다. 만약 원금이 “1” 이고 원금과 이자의합리 수렴하는 경우를 생각한다면 한 가지 경우는 아래 식과 같이 이율과 기간이 서로 반 비례하고 하나가 무한대가 되는 경우입니다. 이렇게 수렴하는 원리합계를 자연상수($e$)라고 합니다.

 

자연에 적용해보기 위하여 이자율을 단위 기간당 자기 복제량이라 생각해 봅니다. 예를 들면 자기 복제량을 1이라 하고 기간을 1시간이라고 한다면 1시간 후에는 처음에 가지고 있는 자기의 크기의 2배가 됩니다. 특별한 경우를 생각하여  복제량과 기간이 서로 반비례하게 되는 경우입니다. 복리계산과 같이 처음 가지고 있던 값을 1이라 하면 복제량은 처음 가지고 있던 값 1에 더해집니다. 처음 가지고 있던 값을 기준값 1이라 했을 때 그의 누적복제량(누적생성량)은 다음식과 같이 됩니다.

 

$$\mathop{\lim}\limits_{{t}\rightarrow{o}}{\left({{1}{+}{t}}\right)}^{\frac{1}{t}}{=}\mathop{\lim}\limits_{{x}\rightarrow\infty}{\left({{1}{+}\frac{1}{x}}\right)}^{x}$$

 

이 값의 최대값은 단위 1기간을 무한개의 기간으로 나누고 복제량(생성량)은 기간에 반비례한다고 하면  $e$로 수렴합니다.

 

$$\mathop{\lim}\limits_{{t}\rightarrow{o}}{\left({{1}{+}{t}}\right)}^{\frac{1}{t}}{=}\mathop{\lim}\limits_{{x}\rightarrow\infty}{\left({{1}{+}\frac{1}{x}}\right)}^{x}=e$$

 

정리하면, 크기 1이 1기간 동안 생성률(미분계수) 1로 시작하여  무한 자기복제를 하면 수렴하게 되는데  그 값이 자연상수($e$)입니다. 자연상수($e$)는 무리수 입니다. 

 

$e = 2.71828…$

 

$${e}{=}\mathop{\lim}\limits_{{t}\rightarrow{o}}{\left({{1}{+}{t}}\right)}^{\frac{1}{t}}{=}\mathop{\lim}\limits_{{x}\rightarrow\infty}{\left({{1}{+}\frac{1}{x}}\right)}^{x}$$


3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


생성단위 자연상수 e : 구글시트 실습

3.2. 구글시트 함수

=EXP(1) : 자연상수 e의 거듭제곱. 괄호안의 숫자는 거듭제곱할 지수. 

=FACT(A3) : 계승. A3에 있는 값보다 작거나 같은 모든 양의 정수의 곱. 예를 들어, A3가 3이라면, 3의 계승은 3, 2, 1의 곱, 즉, $(3\times 2\times 1)$이 됨.

=2^2 : 거듭제곱. 2를 2번 곱함.

=LN(2) : 자연로그. 자연상수 e를 밑으로 하는 자연로그 값. e를 몇 제곱해야 2가 되는지 계산함. 따라서, =LN(EXP(1))의 값은 1이 됨.


3.3. 실습강의

자연상수 e

구글시트 함수로 e 구하기

복리계산식으로 e 구하기

베르누이의 공식으로 e 구하기

테일러 전개로 e 구하기

지수함수

실습 안내



4. 용어와 수식

4.1 용어


e (자연상수, mathematical constant)

오일러 수(Euler’s number)라고도 하는 상수 $e$는 대략 2.71828과 같은 수학적 상수로 여러 측면에서 규정될 수 있습니다. 자연로그의 밑입니다. $n$이 무한대에 가까워질 때의  $(1 + \dfrac{1}{n})n$의 극한값입니다. 복리계산에서 보이는 표현입니다. 무한급수의 합으로 계산할 수도 있습니다.

 

또한 $e$는 함수 $y = ax$의 그래프가 $x = 0$에서 기울기가 1이 되도록 하는 고유한 양의 상수입니다. (자연)지수 함수 $f(x) = e^x$는 고유한 함수 $f$가 도함수와 동일하고 방정식 $f(0) = 1$을 충족합니다. 따라서 $e$를 $f(1)$로 정의할 수도 있습니다. 자연로그 또는 밑이 e인 로그는 자연 지수 함수의 역함수입니다. 숫자$k > 1$의 자연로그는 $x = 1$과 $x = k$사이의 곡선 $y = \dfrac{1}{x}$ 아래의 면적으로 직접 정의할 수 있습니다. 이 경우 $e$는 이 면적이 1일 때의  $k$의 값입니다.

 

상수 $e$는 수학자 Leonhard Euler의 이름을 따서 Euler’s number 또는 John Napier의 이름에서 Napier의 상수라고 합니다. 이 상수는 복리를 연구하던 중 스위스 수학자 Jacob Bernoulli가 발견했습니다. 상수 $e$는 $0, 1, \pi$ 및 $i$와 함께 수학에서 매우 중요한 수입니다. 숫자 5개 모두 오일러의 항등식 $e^{i\pi }+1=0$에 나타나며 수학 전반에 걸쳐 사용됩니다. 상수 ${\pi}$와 마찬가지로 $e$는 무리수(정수 비율로 나타낼 수 없음)이고 초월적(유리계수가 있는 0이 아닌 다항식의 근이 아님)수입니다. 소수점 이하 50자리까지 $e$의 값은 다음과 같습니다.

2.71828182845904523536028747135266249775724709369995…

 

Reference

e (mathematical constant)

회전단위 원주율 pi(π)

1. 애니메이션

1.1. 회전단위 원주율


2. 설명

2.1. 회전단위 원주율


3. 실습

3.1. 구글시트

3.2. 구글시트 함수

3.3. 실습강의


4. 용어와 수식

4.1. 용어


1. 애니메이션



회전단위 원주율 파이(pi, π)


2. 설명

2.1 회전단위 원주율

원의 둘레(원주)와 지름의 비는 항상 일정합니다. 즉, 상수입니다. 그 상수를  π(파이)라 합니다. 십진법으로 쓰면 3.141592..인 무리수입니다. 즉, 숫자로는 표현할 수 없는 수입니다. 원둘레의 길이는 지름의 3배에서 4배사이라고 고대부터 알고 있었습니다. 따라서 수레가 사용된 시대부터는 길이를 재는 용도 등으로 폭넓게 사용되었습니다.

 

원주율 π

π=lr\pi=\dfrac{l}{r}

여기서,  $l$은 원의 둘레

$r$은 원의 반지름

지름 1인 원이

1회전동안 진행한 길이

π = 3.14159…

 

반지름 1인 원이

1회전동안 진행한 길이

2π=6.28318…

 

이 상수는 회전단위인 각도를 표시할 때 사용됩니다. 1 radian(라디안)은 반지름과 호(각도가 나타내는 원의 둘레)의 길이가 같을 때의 각도 입니다. 그래서 한 회전의 각도(360도)는 2π로 표현됩니다. 여기서 radian은 반복의 단위인 주파수에서도 사용됩니다. 예를 들면, 1초동안 몇 번 반복하는가 입니다. 1초동안 1번 제자리로 돌아오면 1Hz(헤르츠)입니다.  이 때 1Hz는 2π/sec로 생각할 수 있습니다.

 

애니메이션에서 길이가 2π인 직선과 원의 둘레(원주) 2π는 값은 같습니다. 그렇지만 원의 둘레를 펴는 과정에서 길이를 이루는 모든 점의 회전각을 모두 더하면 한 회전이 됩니다. 즉, 길이를 이루는 점들은 제자리에서 크기는 변하지 않은 채 조금씩 회전을 한 셈입니다.

 

원주율을 원의 반지름과 원의 둘레의 비로 정의하고 각도를 나타낼 때 사용한다면 360진법으로 나타내는 360°각도와 원주율로 나타내는 각도의 차이는 분명합니다. 원주율의 비로 각도를 나타내면 회전수도 나타낼 수 있고 각도의 증감도 표시할 수 있습니다. 더나아가 각속도와 각가속도도 표현할 수 있습니다. 여기서 원주율로 원운동을 표현하려면  반지름이 존재함을 전제로 합니다. 따라서 방향만 변화하는 경우에는 다른 표현방법이 필요합니다. 그리고 확률에서는 점으로 표현되는 개체(object)의 출현시기를 점의 방향으로 결정하는 모형을 만들기도 합니다. 반면, 통계에서는 점으로 표현되는 개체의 관측시기를 점의 방향으로 나타내기도 합니다.


3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.



3.2. 구글시트 함수

=PI() : 파이(pi) 값. 소수점 이하 14자리까지의 파이(pi)값을 표시.

=RADIANS(180/100) : 360도 중 도 단위를 라디안으로 변환. 180/100, 즉 1.8도를 라디안으로 변환.

=SIN(RADIANS(180/100)) : 라디안으로 입력된 각도의 사인. 180/100, 즉 1.8도를 라디안으로 변환 후, 사인값을 표시.

=SUM(C:C) : 합계. C열에 있는 모든 데이터의 합계를 표시.

=SQRT(6*SUM(C:C)) : 제곱근. C열에 있는 모든 데이터를 더한 값에 6을 곱한 후, 제곱근을 구함.


3.3. 실습강의

파이(pi, π)

구글시트 함수로 파이 구하기

정사각형의 둘레로 파이 구하기

라이프니츠의 공식으로 파이 구하기

오일러의 곱셉 공식으로 파이 구하기

실습 안내



4. 용어와 수식

4.1 용어


원주율

숫자에서 무리수인 π(원주율, 파이로 읽음)는 원의 둘레($l$)와 지름($r$)의 비율인 수학 상수로 대략 $3.14159\cdots$와 같습니다. 무리수 π는 수학과 물리학 전반에 걸쳐 많은 공식에 나타납니다. 22/7과 같은 분수가 일반적으로 근사화하여 사용하지만 이는 무리수입니다. 즉, 두 정수의 비율로 정확하게 표현할 수 없습니다. 결과적으로 십진수로 표현할 때 자리수가 끝나지 않고 영구적으로 반복되는 패턴입니다. 원주율은 초월수로서 합, 곱, 거듭제곱, 정수만을 포함하는 방정식의 해가 될 수 없음을 의미합니다. π의 초월은 나침반과 직선자로 원을 제곱하는 고대의 과제를 해결하는 것이 불가능하다는 것을 의미합니다. π의 십진수는 무작위로 분포된 것으로 보이지만 이 추측에 대한 증거는 발견되지 않았습니다.

 

수천 년 동안 수학자들은 π의 값을 높은 정확도로 계산함으로써 π에 대한 이해를 넓히려는 시도를 해왔습니다. 이집트와 바빌로니아를 포함한 고대 문명은 실제 계산을 위해 상당히 정확한 π의 근사값을 필요로 했습니다. 기원전 250년경에 그리스 수학자 아르키메데스는 임의의 정확도로 π를 근사하는 알고리즘을 만들었습니다. 서기 5세기에 중국 수학자들은 π를 7자리로 근사하였고 인도 수학자들은 기하학 기술을 사용하여 5자리의 근사값을 구했습니다. 무한 급수를 기반으로 하는 π에 대한 첫 번째 계산 공식은 천년 후에 발견되었습니다. 원의 둘레와 지름의 비율을 나타내기 위해 그리스 문자인 π의 최초의 사용은 1706년 웨일스의 수학자 William Jones가 사용한 것으로 알려져 있습니다.

 

미적분학의 발전은 모든 실용적인 계산에 충분한 π의 수백 자리의 계산으로 이어졌습니다. 그럼에도 불구하고, 20세기와 21세기에 수학자와 컴퓨터 과학자들은 증가하는 계산 능력과 결합하여 π의 십진법 표현을 수조 자릿수로 확장하는 새로운 접근 방식을 찾았습니다. 이러한 시도는 급수를 계산하기 위한 효율적인 알고리즘의 개발과 자리수 기록을 깨려는 인간의 탐구에 의해 동기가 부여되었습니다. 슈퍼컴퓨터를 테스트하는 데에도 사용되었습니다.

 

원주율의 정의는 원과 관련이 있기 때문에 π는 삼각법 및 기하학의 많은 공식, 특히 원, 타원 및 구와 관련된 공식에서 발견됩니다. 또한, 우주론, 프랙탈, 열역학, 역학, 전자기학과 같은 과학의 여러주제의 공식에서도 발견됩니다. 현대의 수학적 분석에서는 기하학에 대한 참조 없이 대신 정의되는 경우가 많습니다. 따라서 정수론이나 통계와 같이 기하학과 거의 관련이 없는 영역에서도 나타납니다. π의 넓은 효용성은 π를 과학 안팎에서 가장 널리 알려진 수학 상수 중 하나로 만듭니다. π에 관한 많은 책이 출판되었으며 최대기록의  π의 자릿수 계산은 종종 뉴스 헤드라인을 장식합니다.

 

Reference

Pi – Wikipedia

차원단위
Unit of dimension

1. 애니메이션

1.1. 차원단위


2. 설명

2.1. 차원단위


3. 실습

3.1. 구글시트

3.2. 구글시트 함수

3.3. 실습강의


4. 용어와 수식

4.1. 용어


1. 애니메이션



차원단위


2. 설명

2.1 차원단위

0은 아무것도 없다는 관념적인 기준입니다. 현실에서도 아무것도 존재하지 않는 상태를 기준으로 사용하는 경우가 많이 있습니다. 0은 자신을 아무리 더해도 자신이 됩니다.

 

0과 대비되어 나온 1은  “있다”라는 의미입니다. 역시 관념적인 단위입니다. 1은 자신을 아무리 곱해도 자신이 되지만 더하면 더하는 횟수만큼 값이 늘어나게 됩니다. 그래서  “1”은 곱하기의 기준이 되고 더하기의 단위가 됩니다. 그리고  0과 1사이의 값과 1이상의 값의 경계인 1은 곱하기와 나누기의 경계가 됩니다.

한편, 0은 양수와 음수의 경계, 즉 더하기와 뺴기의 경계가 됩니다.

 

0과 1에 물리적인 단위가 붙으면 우리가 인지할 수 있는 단위가 됩니다.

길이 단위로는 meter, 질량단위로는 gram등이 있습니다. 이것은 합의하여 정한 것입니다. 단위가 있으면 기준이 있어야 하는데 이 또한  단위를 사용하는 주체의 합의가 있어야 합니다.

 

점(point)이 모여서 선(line)이 됩니다.

점(point)의 길이는 0입니다.

선은 단위(unit)가 있습니다.

선은 1차원(dimension)입니다.

선의 단위는 1 하나로 이루어 집니다.

 

선(line)이 모여서 면적(area)가 됩니다.

선(line)의 면적은 0입니다.

면적은 단위(unit)가 있습니다.

면적은 2차원(dimension)입니다.

면적의 단위는 1, 1 두개로 이루어 집니다.

 

면적(area)이 모여서 부피(volume)가 됩니다.

면적(area)의 부피는 0입니다.

부피는 단위(unit)가 있습니다.

부피는 3차원(dimension)입니다.

부피의 단위는 1, 1, 1 세개로 이루어 집니다.

 

 


3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


차원단위

3.2. 구글시트 함수

=준비 중 입니다.. 


3.3. 실습강의

데이터

당도의 제곱

당도 편차의 제곱

당도 편차와 과중 편차의 곱



4. 용어와 수식

4.1 용어

데이터 선택과 분리
Data selection and separation

1. 애니메이션

1.1. 데이터 선택

1.2. 데이터 분리


2. 설명

2.1. 데이터 선택과 분리


3. 실습

3.1. 구글시트

3.2. 구글시트 함수

3.3. 실습강의


4. 용어와 수식

4.1. 용어


1. 애니메이션



데이터 선택




데이터 분리


2. 설명

2.1 데이터 선택과 분리

데이터를 살펴보면 첫번째 열은 요소명입니다. 즉, 딸기의 당도를 측정할 때 부여한 딸기 번호입니다. 그래서 딸기의 특성을 나타내는 데이터가 아닌 측정편의상 부여한 것입니다.

 

필요한 데이터를 분리하면 변수명인 당도와 20개의  변수값인 데이터입니다. 20개의 당도 데이터와  딸기개수로 총 21개의 데이터를 분리해 내었습니다. 즉, 데이터 개수인 20이라는 숫자도 중요한 데이터로 취급됩니다. 데이터를 분리하여도  당도라는 변수명은 그대로 사용합니다.


3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.



3.2. 구글시트 함수

=SUM(B3:B22) : 합계. 


3.3. 실습강의

데이터 복사

데이터 참조



4. 용어와 수식

4.1 용어

정형데이터
Structured data

1. 애니메이션

1.1. 정형데이터의 요소(element)

1.2. 정형데이터의 변수(variable)

1.3. 정형데이터의 요소명과 변수


2. 설명

2.1. 정형데이터


3. 실습

3.1. 구글시트

3.2. 구글시트 함수

3.3. 실습강의


4. 용어와 수식

4.1. 용어


1. 애니메이션



정형데이터의 요소(element)




정형데이터의 변수(variable)




정형데이터의 요소명과 변수


2. 설명

2.1 정형데이터

데이터의 종류에서 정형데이터는 비정형데이터와 달리 가로와 세로로 구성된 칸안에 들어가는 값으로 표현될 수 있는 데이터입니다. 가로줄을 행(row)이라하며 세로줄을 열(column)이라 합니다. 한편,  머신러닝에서는 “행”은 예제(example),  “열”은 속성(attribute)이라고 합니다.

 

정형데이터(data)는 계열(family)로 구성됩니다. 계열은 세로줄 “열(column)”로 표현되며 변수명(variable name)과 변수(variable)로 구성되어 있습니다. 여기서 변수를 좁은 의미의 데이터라고 합니다. 그리고 변수의 값을 변수값 또는 데이터라고 합니다.

 

한편, 데이터는 요소(element)가 모여 있는 집합입니다. 요소는 가로줄 “행”으로 표현되며 개체(object) , 기록(record)이라고도 합니다. 각 요소는 요소명(element name)과 변수(variable)로 구성됩니다. 요소의 예로 인간을 들면 각 인간은 키와 체중이라는 이름을 가지는 변수를 가지고 있습니다. 한 요소에서의 변수값들은 좁은 의미의 데이터라고도 하고 관측값, 측정값, 관찰값 등으로 불리웁니다.


3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.



3.2. 구글시트 함수

=SUM(B3:B22) : 합계 


3.3. 실습강의

비정형 데이터 요약

비정형 데이터 시각화

정형 데이터 요약

정형 데이터 시각화

정형 데이터 활용



4. 용어와 수식

4.1 용어

데이터 종류
Data type

1. 애니메이션

1.1. 데이터 종류


2. 설명

2.1. 데이터 종류


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 용어

4.1. 용어

 


1. 애니메이션



데이터 종류


2. 설명

2.1. 데이터 종류

형식에 따라 구분되는 데이터  종류는 정형데이터와 비정형데이터가 있습니다. 정형데이터(structured data)는 미리 정의된 형식이 있는 데이터를 의미합니다. 따라서 정형데이터는 스프레드시트(구글 시트, 엑셀)에서 형식을 지정하여 사용할수 있습니다. 비정형데이터(unstructured data)는 미리 정의된 형식이 없는 데이터를 말합니다. 비정형데이터는일반적으로 텍스트 중심으로 되어 있으나 “날짜에 따른 사건일지”와 같이 숫자 데이터도 포함될 수 있습니다.

 

척도에 따라 구분되는 데이터 종류는 양적데이터와 질적데이터가 있습니다. 질적데이터에서 명목척도는 남자, 여자와 같은 질적 정의를 “남자=1”, “여자=2” 처럼 수치화 시킨 것입니다. 질적데이터에서 순서척도는 “일인당 국민소득이 높은 나라 순위”처럼 순서를 수치화한 것입니다. 양적데이터에서 간격척도는 “온도”와 “시각”처럼 간격을 수치화한 것입니다. 양적데이터에서 비례척도는 “비만도”처럼 기준에 대한 비례를 수치로 표현한 것입니다.

 

속성에 따라 구분되는 데이터 종류는 연속형데이터(continuous data)와 범주형데이터(Categorical data)가 있습니다. 연속형데이터는 키, 몸무게, 시간, 혈압, 경제성장률과 같이 연속적인 수치로 표현된 데이터 입니다. 정확한 값이 있는데 어떻게 연속형데이터로 명명할 수 있는가 하고 의문을 가질 수 있습니다. 연속형데이터는 아날로그라고 할 수 있습니다. 즉, 유한개의 숫자로는 표현이 안되고 무한한 숫자로 표현해야 하는 데이터를 의미합니다. 따라서 연속형데이터는 구간(계급, bin, bucket)을 두어 범주형데이터로 바꾸어 사용합니다. 연속형데이터를 측정한 값은 엄밀히 말하면 범주형데이터로 바뀐  것입니다. 범주형데이터는 “나이”, “시험점수” 등과 같이 명확한 자리수를 가지는 수치로 표현된 데이터입니다. 범주형데이터는 디지털이라고 할 수 있습니다. 즉 유한개의 숫자로 표현할 수 있습니다.

 

참고로 수집에 따른 데이터 종류도 있습니다. 원시데이터는 처음 수집한 데이터입니다. 가공데이터는 1개 또는 다수개의 원시데이터에서 선택과 분리를 한 데이터입니다. 그리고 원시데이터나 가공데이터를 가지고 연산하여 나온 데이터도 가공데이터로 볼 수 있습니다. 정리하자면 원시데이터들에서 많은 가공데이터가 만들어질 수 있습니다.


3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


데이터 종류 : 구글시트 실습

3.2. 함수

=SUM(B3:B22) : 합계. 셀의 합계 혹은 입력한 숫자의 합계를 계산해서 표시. B3와 B22의 범위에 있는 모든 숫자의 합계를 계산해서 표시.

=COUNTA(B3:B22) : 데이터 개수. 숫자와 텍스트로 표시된 모든 데이터의 개수를 표시함. B3에서 B22에 있는 모든 데이터의 개수를 표시함.

=COUNT(C3:C22) : 데이터 개수. 숫자로 표시된 데이터의 개수만 표시함. C3에서 C22에 있는 숫자로 표시된 데이터의 개수를 표시함.

=AVERAGE(B3:B22) : 평균. B3에서 B22에 있는 데이터의 평균을 구함. 데이터를 모두 더해서 개수로 나눔. 산술평균.

=MEDIAN(B3:B22) : 중앙값(중간값). B3에서 B22에 있는 모든 숫자의 중앙값을 표시함. 데이터의 개수가 짝수일 경우, 가운데 있는 두 수의 평균을 계산해서 표시함.


3.3. 실습강의

 – 데이터

 – 합계

 – 개수

 – 평균

 – 중앙값



4. 용어

4.1 용어


데이터

데이터는 질적 또는 양적 변수값의 집합입니다. 데이터와 정보 또는 지식은 종종 같은 의미로 사용하지만 데이터를 분석하면 정보가 된다고 볼 수 있습니다. 데이터는 일반적으로 연구의 결과물로 얻어집니다. 한편, 데이터는 경제(매출, 수익, 주가 등), 정부(예 : 범죄율, 실업률, 문맹율)와  비정부기구(예 : 노숙자 인구 조사)등 다양한 분야에서도 나타납니다. 그리고 데이터를 수집 및 분석하고 시각화할 수 있습니다.

 

일반적인 개념의 데이터는 응용이나 처리에 적합한 형태로 표현되거나 코딩됩니다. 원시 데이터 ( “정리되지 않은 데이터”)는  “정리”되기 전의 숫자 또는 문자의 모음입니다. 따라서 데이터의 오류를 제거하려면 원시 데이터에서 데이터를 수정해야 합니다. 데이터 정리는 일반적으로 단계별로 이루어지며 한 단계의 “정리 된 데이터”는 다음 단계의 “원시 데이터”가 됩니다. 현장 데이터는 자연적인  “현장”에서 수집되는 원시 데이터입니다. 실험 데이터는 관찰 및 기록을 통한 과학적 조사에서 생성되는 데이터입니다. 데이터는 디지털 경제의 새로운 자원입니다.

 

Reference

Data – Wikipedia


 


데이터세트

데이터세트는 데이터의 집합입니다. 일반적으로 데이터세트는 단일 데이터베이스 테이블의 내용 또는 테이블의 모든 열이 특정 변수를 나타내는 단일 통계 데이터 행렬에 해당하며 각 행은 해당 데이터 집합의 특정 구성요소에 해당합니다. 데이터세트에는 각 개체의 변수값이 나열됩니다. 각 변수값을 데이텀이라고 합니다. 데이터세트는 행의 수에 대응하는 하나 이상의 개체(Member)에 대한 데이터를 포함합니다. 데이터세트라는 용어는 특정 실험이나 이벤트에 해당하는 데이터를 적용하기 위해 좀 더 광범위하게 사용될 수도 있습니다.

 

데이터세트 보다 덜 사용되는 이름은 데이터 자료 및 데이터 저장소입니다. 사용 예는 우주인이 우주 탐사선을 타고 실험을 수행하여 데이터세트를 수집하는 것입니다. 매우 큰 데이터세트는 일반적인 데이터 처리프로그램이 처리하기에 부적합한데 이를 빅 데이터라고 합니다.공개 데이터 분야에서 데이터세트는 공공 데이터저장소에서공개정보를 측정하는 단위입니다. European Open Data 포털은 50 만 개 이상의 데이터세트를 가지고 있습니다.

 

Reference

Data set – Wikipedia