2차원 산점도 ?
2D scatter plot ?

1. 애니메이션

1.1.딸기의 과중과 당도를 나타내는 2차원 산점도

1.2 딸기의 출하일과 당도를 나타내는 2차원 산점도


2. 설명

2.1. 2차원 산점도


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 용어

4.1. 용어

4.2. 참조

1. 애니메이션



딸기의 과중과 당도를 나타내는 2차원 산점도




딸기의 출하일과 당도를 나타내는 2차원 산점도

2. 설명

2.1.  2차원 산점도

20개의 딸기의 과중과 당도를 측정한 데이터가 있습니다. 데이터를 보면 딸기 하나에 과중과 당도, 두 개의 데이터(변수값)가 있습니다. 딸기의 과중과 당도의 관계를 탐색하기 위하여 두 변수의 관계를 시각화하는 산점도(scatter plot)를 그립니다.

딸기 하나를 한 점(point)으로 생각하고 딸기 하나가 독립된 두 변수를 가진다면, 2차원 직각 좌표계에  점으로 딸기를 나타낼 수 있습니다. 결과적으로 딸기가 20개이므로 20개의 점이 평면좌표계에 찍힙니다. 산점도를 그릴 때는 보통, 원인이 되는 변수를 $X$축(가로축), 결과를 나타내는 변수를 $Y$축(세로축)으로 정합니다. 따라서 과중과 당도를 각각 $X$축과  $Y$축에 나타냅니다.

애니메이션의 산점도를 보면 과중이 클수록 당도가 높게 나옵니다. 딸기가 무거울수록, 즉, 큰 딸기일수록  달다고 해석할 수 있겠습니다. 두번째 애니메이션에서는 20개 딸기의 출하일과 당도를 기록한 데이터를 다룹니다. 산점도를 보면 출하일이  겨울에 가까울수록 딸기가 달다는 것을 알 수 있습니다.

산점도는 데이터의 요소가 가지는 두 변수의 상관 관계를 분석하는 그래프입니다. 특히,  두 연속형 변수의 관계를 분석하는데 매우 효율적입니다. 2차원 산점도는 개체(object, 요소, element)의 한 변수를 $X$축,  다른 변수를 $Y$축으로 하여 각각의 관찰값을  $XY$ 평면상의 점으로 나타내는 “데이터시각화”입니다.

두 개의 변수에서 한쪽이 증가하면 다른 쪽도 증가하는 관계를 양의 상관이라고 합니다. 반대로 한쪽이 증가하면 다른 쪽은 줄어드는 관계를 음의 상관이라고 합니다.

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


2차원 산점도 : 구글시트 실습

3.2. 구글시트 함수

=AVERAGE(B3:B22) : 평균. B3에서 B22에 있는 데이터의 평균을 구함. 데이터를 모두 더해서 개수로 나눔. 산술평균.


3.3. 실습강의

– 데이터

– 산점도

– 세로축 범위 조정

– 실습 안내


4. 용어

4.1. 용어


산점도

산점도(산포도)는 일반적으로 여러 변수를 가지는 개체를 표시하기 위해 직각  좌표계를 사용하는 그래프 유형입니다. 점이 시각적으로 정의된 경우 (색상 / 모양 / 크기) 하나의 추가 변수로 표시 될 수 있습니다. 3차원 산점도에서 데이터는 수평 축상의 위치를 결정하는 하나의 변수 값과 수직축 상의 위치를 결정하는 다른 변수의 값을 갖는 점들의 모음으로 표시됩니다.

Reference

Scatter plot – Wikipedia



4.2. 참조


Reference

Wikipedia

1차원 산점도 ?
1D scatter plot ?

1. 애니메이션

1.1. 1차원 점그래프 (과중)


2. 설명

2.1. 1차원 산점도

2.2. 설명강의


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 용어

4.1. 용어

4.2. 참조

1. 애니메이션



1차원 점그래프 (과중)

2. 설명

2.1 1차원 산점도

1차원의 연속형변수값들을 시각화하는 방법 중에 직관적인 방법은 직선좌표계에 변수값을 점으로 표시하는 것입니다. 직선좌표계의 원점(Origin)을 0으로 하면 변수값들은 원점으로부터 양방향으로 나눠지는 영역에 점으로 표시됩니다. 

애니메이션에서는 딸기의 당도가 모두 양수이므로 직선좌표계의 원점(0)의 오른편에 점들로 데이터가 표시되고 있습니다.

데이터를 산점도를 사용해서 시각화할때 점들이 중복되어 나타나는 것이 가장 큰 애로점입니다. 이것을 해결하기 위하여 여러가지 표현방법이 동원되지만 근원적인 해결은 되지 못합니다. 그래서 같이 사용되는 것이 도수분포도입니다. 한편, 데이터사이언스에서는 도수분포도가 1차원 데이터를 가지는 표본의 확률분포를 표시하는데 주로 사용됩니다. 정리하면 1차원 산점도와 도수분포도는 밀접한 관계를 가지며 도수분포도는 1차원 산점도를 변수의 구간을 정하는 조작을 통해 더 확실하게 시각화한 것입니다. 물론 구간의 간격을 정하는 과정에서 정보가 왜곡될 수 있다는 어려움이 있습니다.

딸기가 당도외에 또 하나의 변수를 가질 때는 2차원 산점도로 확장할 수 있습니다. 그래프로 표시한 변수를 X축 다른 변수를 Y축으로 하여 각각의 관찰값을 XY 평면좌표계의 좌표값으로 정합니다.

산점도를 점그래프라고도 합니다. 1차원 산점도를 확장해서 2차원 산점도를 그리려면 2차원 좌표계, 즉 평면좌표계에서 점을 찍습니다. 직각좌표계를 사용한다면 한 점당, X좌표, Y좌표 두개의 변수값이 필요합니다. 3차원좌표계,  즉 공간좌표계에서는 3개의 변수값이 필요합니다. 


2.2. 설명강의

– 준비 중


3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


1차원 산점도 : 구글시트 실습

3.2. 함수

=ROWS(F2:F2) : 지정된 배열 또는 범위에 있는 행의 개수.


3.3. 실습강의

– 데이터

– 범위

– 히스토그램

<실습강의 내용>

데이터

범위

히스토그램

4. 용어

4.1 용어


제목

내용.

Reference

Title – Wikipedia


4.2. 참조


Reference

Wikipedia

히스토그램과 확률밀도함수 ?

1. 애니메이션

1.1. 확률밀도함수

1.2. 도수분포표로 히스토그램 그리기


2. 설명

2.1. 히스토그램과 확률밀도함수


3. 실습

3.1. 구글시트

3.2. 구글시트 함수

3.3. 실습강의


4. 용어와 수식

4.1. 용어

 


1. 애니메이션



확률밀도함수




도수분포표로 히스토그램 그리기


2. 설명

2.1 히스토그램과 확률밀도함수

도수분포를 관찰하기 위하여 도수분포표를 만듭니다. 같은 간격으로 변수의 구간을  정하였을 때,  각 구간에 속하는 변수값(데이터)의 갯수를 도수(빈도수)라고 합니다. 도수는 각 구간에 변수가 나타나는 횟수입니다. 구간별로 도수를 나타내는 표가 도수분포표입니다.

 

도수분포표를 시각화하는 것이 히스토그램입니다. 히스토그램은 각 구간을 직사각형으로 표현하는데 밑변은 구간의 간격이 되고 높이는 빈도수를 나타냅니다. 여기서 빈도수를 상대 빈도수로 바꾸면 히스토그램을 이루는 직사각형의 높이는 그 구간을 대표하는 확률인 확률질량을 나타냅니다.  각 구간의 확률질량을 모두 더하면 1이 됩니다. 각 구간의 상대도수는 각 구간의 빈도수를 전체 빈도수로 나눈 값입니다. 즉, 전체 빈도수에서 각 구간의 빈도수가 차지하는 비율입니다.

 

히스토그램이 나타내는 도수를 상대도수로 바꾼 것을 상대도수 히스토그램이라 하겠습니다. 상대도수 히스토그램을 다시 확률밀도 함수로 바꾸어 봅니다. 상대도수 히스토그램에서 구간의 간격으로 상대도수를 나누면 상대도수 히스토그램은 확률밀도함수를 나타냅니다. 즉, 상대도수를 구간의 간격으로 나눈 값이 확률밀도가 됩니다. 각 구간의 직사각형의 윗변의 처음과 시작을 이상과 미만으로 표시하면  확률밀도함수를 나타냅니다. 이 확률밀도함수는 모양은 이산(discrete)로 나타남으로 이산확률밀도함수입니다.

 

만일, 상대도수 히스토그램의 간격이 무한소가 되면서 동시에 상대도수를 구간의 간격으로 나눈다면 상대도수 히스토그램은 연속확률밀도함수로 변화합니다.

 


3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.



3.2. 구글시트 함수

=COUNT(B3:B22) : 데이터 개수. B3에서 B22에 있는 숫자로 표시된 데이터의 개수.

=AVERAGE(B3:B22) : 평균. B3에서 B22에 있는 데이터의 평균.

=VAR.S(B3:B22) : 표본분산. B3에서 B22에 있는 데이터의 표본분산. 편차제곱합을 데이터 개수 -1로 나눔.

=STDEV.S(B3:B22) : 표본표준편차. B3에서 B22에 있는 데이터의 표본표준편차. 표본분산의 제곱근.

=MIN(B3:B22) : 최소값. B3에서 B22에 있는 데이터 중에서 최소값을 표시함.

=MAX(B3:B22) : 최대값. B3에서 B22에 있는 데이터 중에서 최대값을 표시함.

=SQRT(D3) : 제곱근. D3값의 제곱근.

=ROUNDUP(SQRT(D3)) : 올림. D3값의 제곱근의 올림값.

=ROUND(M3/N3,2) : 반올림. M3값을 N3값으로 나눈 값을 반올림해서 소수점 2번째자리까지 표시.

=FREQUENCY(B3:B22,R3:R7) : 빈도수. B3에서 B22에 있는 데이터를 R3에서 R7까지의 구간에 맞춰 빈도수를 구함.

=S3/SUM(S3:S7) : 합계. S3에서 S7에 있는 데이터의 합계. 

=NORMDIST(Y3,E3,G3,FALSE) : 정규분포 확률밀도. E3가 평균, G3가 표준편차인 정규분포 상에서 Y3값의 확률밀도를 계산함. FALSE 대신 TRUE를 넣으면, 누적확률밀도를 계산함. 


3.3. 실습강의

– 데이터

– 표본통계량

– 도수분포표

– 히스토그램

– 상대도수 히스토그램

– 정규분포

– 실습 안내



4. 용어와 수식

4.1 용어


히스토그램

데이터값의 분포를 표현하는 방식중의 하나입니다.  연속확률변수의 확률값을 막대그래프 모양으로 표현한 것입니다. Karl Pearson에 의해 처음 소개되었습니다.

히스토그램을 작성하려면 먼저 변수 범위를 구간(“bin”또는 “bucket”)으로 나눕니다. 그리고  각 구간에 몇 개의 데이터 값이 속하는 지를 정리합니다. 구간은 연속적이고 겹치지 않고 인접해야 하며 같은 간격이면 분석에 용이합니다.(구간 간격이 꼭 같아야 하는 것은 아닙니다.)

직사각형(막대)의 높이에 비례하는 빈도수는 상대빈도수로 정규화될 수 있습니다.  구간들이 동일한 간격이고 간격이 1인 경우, 빈도수를 정규화하게 되면 각 직사각형의 높이는 상대빈도수를 표현하는 확률이 되어 각 직사각형의 높이의 합은 1이 됩니다. 그러나 구간은 동일한 폭(구간크기)일 필요는 없습니다. 이 경우 직사각형(막대)은 구간의 빈도수에 비례하는 면적을 갖도록 정의됩니다 . 수직축은 빈도수가 아니라 빈도수밀도(수평축상의 변수의 단위당 경우의 수)입니다. 모양은 막대 그래프의 막대가 서로 인접한 모양으로 변수가 연속적으로 표현되었다는 것이 중요합니다.

 

히스토그램은 데이터의 기본 확률분포밀도를 대략적으로 나타내며, 확률밀도 추정시 자주 사용됩니다 . 즉, 기본 확률변수의 확률밀도함수를 나타냅니다 . 확률 밀도에 사용되는 히스토그램의 총 면적은 항상 1로 정규화됩니다. $X$ 축의 간격이 모두 1이면 히스토그램은 상대빈도 막대그래프와 동일합니다 . 히스토그램은 통계적 속성을 모델링해야 할 때 통계 패키지 프로그램에서 자주 쓰입니다. 예를 들면, 커널 밀도 추정치의 상관 관계 변이는 수학적으로 설명하기가 매우 어렵지만 각 구간이 독립적으로 변하는 히스토그램에서는 이해하기가 쉽습니다. 커널 밀도 추정의 대안은 평균 이동된 히스토그램입니다  계산 속도는 빠르며 커널을 사용하지 않고 밀도를 부드럽게 계산할 수 있습니다.

 

히스토그램은 때때로 막대그래프와 혼동됩니다.히스토그램은 연속 데이터에 사용되기 때문에 막대는 붙어 있게 됩니다.  그래서 구별을 분명히 하기 위해 막대그래프는 막대 사이에 간격을 줍니다.

 

Reference

Histogram – Wikipedia


 


확률밀도함수

확률에서 확률밀도함수(PDF) 또는 연속확률변수의 밀도는 표본공간의 임의의 표본(또는 점)의 확률변수의 값이 같다면 같은 확률을 가진다는 것입니다. 다른 말로 하면, 임의의 연속확률변수에 대한 확률값은 0이지만  두 개의 서로 다른 확률변수 값에서 PDF의 값을 사용하여 유추할 수는 있습니다. PDF는 임의의 확률변수에서의 확률값을 취하는 것보다는 특정 확률변수 범위 내에서 임의의 확률변수가 있을 확률을 나타내는데 사용됩니다. 확률은 확률변수의 범위에 대한  PDF의 적분값으로 주어집니다. 확률밀도함수는 모든 곳에서 음수가 아니며 전체 확률변수범위에 대한 적분은 1이 됩니다.

 

“확률분포함수”와 “확률함수”라는 용어는 때로는 확률밀도함수를 의미하기도 하지만 이 용어는 표준이 아닙니다. 한편, 확률질량함수(PMF)는 이산확률변수 (불연속 확률변수)에서 사용되는 반면, 확률밀도함수(PDF)는 연속확률변수에서 사용됩니다.

 

Reference

Probability density function – Wikipedia


도수분포 탐색 – 히스토그램

1. 애니메이션

1.1. 도수분포표로 히스토그램 그리기

1.2. 1차원 산점도


2. 설명

2.1. 히스토그램

2.2. 히스토그램 활용


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 참조

4.1. 용어

4.2. 참고문헌

1. 애니메이션



도수분포표로 히스토그램 그리기




1차원 산점도

2. 설명

2.1.히스토그램(histogram)

히스토그램

히스토그램은 구간(범주)에 속한 개체의 도수(빈도수)를 직사각형의 높이로 표현한 것입니다. 이 때 직사각형의 밑변의 길이는 등간격을 가지는 구간이 됩니다. 그리고 히스토그램을 이루는 각 구간의 직사각형은 서로 붙여서 그립니다. 따라서 히스토그램은 구간에 따른 개체의  도수분포를 나타낸다고 볼 수 있습니다.

 

한편, 순서가 없는 범주로 구분된 개체의 도수는 막대그래프로 표현합니다. 막대그래프에서는 범주의 위치를 표현할 수 없지만 히스토그램에서는 범주의 위치를 구간의 길이와 순서로 나타낼 수 있습니다. 히스토그램에서는 구간이 만드는 직사각형을 붙여서 그리므로 범주의 위치가 있음을 시각화합니다. 정리하면, 범주에 속하는 개체의 도수는 막대그래프로 표현할 수 있습니다. 이 때, 범주의 위치를 실수로 표현하고자 하는 경우 히스토그램을 사용합니다.

 

히스토그램 작성

히스토그램을 그리기 위해서는 데이터(변수값)의 범위(range)가 정해져야 합니다. 데이터의 범위는 데이터의 최대값과 최소값의 차로 구합니다. 그리고 동일한 간격을 가지는 구간(계급, bin, bucket)을 정합니다. 각 구간에 속하는 개체(object)의 개수를 그 구간의 도수(빈도수, frequency)라고 합니다. 도수는 자연수이며 각 구간을 밑변으로 하는 직사각형의 높이로 표현됩니다. 각 구간의 간격이 같기 때문에  히스토그램의 면적은 각 구간의 도수와 비례합니다. 즉, 히스토그램을 이루는 각 직사각형의 면적과 그 직사각형이 의미하는 범주에 속하는 개체의 도수는 선형관계입니다. 

 

‘범위를 몇 개의 등간격인 구간으로 나눌 것인가?’는 히스토그램을 그리기 위한 중요한 결정사항입니다. 구간의 개수를 정하는 방법은 데이터 개수의 제곱근에 근사한 정수로 하는 방법 등 여러가지가 제시되고 있습니다. 구간의 개수가 정해지면 연속형 변수의 범위(최대값-최소값)를 구간의 개수로 나누어 구간을 구합니다. 각 구간의 시작점과 끝점은 보통  ‘~ 이상($≥$)에서 ~ 미만($<$)’으로 정합니다.


2.2. 히스토그램의 활용

히스토그램은 관심있는 확률변수가 나타내는 확률분포를 유추하는 방법으로 활용됩니다. 히스토그램은 확률변수가 실현된 개체의 분포를 시각화하여 확률분포를 유추합니다. 히스토그램은 관심있는 확률변수의 확률분포를 닮은 모양을 보여줌으로 확률변수에 적합한 확률분포함수를 찾기 위한 탐색에 사용됩니다. 확률변수를 수식으로 모델링할 때 확률변수를 관측한 데이터로 히스토그램을 작성하여 모양을 살펴봅니다. 히스토그램의 도수를 상대도수로 변환하고 간격을 범위와 간격의 비로 변환하면 불연속적인 확률밀도함수를 그려볼 수 있습니다. 변환한 히스토그램의 직각사각형들의 면적의 합은 1이 됩니다.

 

히스토그램의 중요한 점은 면적의 크기로 도수를 표현한다는 것입니다. 이는 면적으로 데이터의 빈도를 표현한다는 점에서 면적으로 확률을 표현하는 확률밀도함수와 같습니다. 관측한 범주(구간)에서의 개체의 도수(빈도수)는 확률로 모델링됩니다. 연속형 확률변수를 모델링하는 확률밀도함수를 정하기 위해 관측 데이터를 탐색하는 매우 유용한 데이터시각화 방법입니다.

 

한편, 개체가 가지는 연속형 변수의 관측값(데이터)을 1차원 산점도로 시각화하면 점이 중첩되어 개체의 분포를 표현하기 어려운 경우가 많이 발생합니다. 이 때는 구간을 나누어야 하는 과정이 필요하지만 히스토그램이나 점그래프를 사용하여 개체의 분포를 표현합니다.

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


히스토그램 : 구글시트 실습

3.2. 구글시트 함수

=COUNT(B3:B22) : 데이터 개수. B3에서 B22에 있는 숫자로 표시된 데이터의 개수.

=AVERAGE(B3:B22) : 평균. B3에서 B22에 있는 데이터의 평균.

=VAR.S(B3:B22) : 표본분산. B3에서 B22에 있는 데이터의 표본분산. 편차제곱합을 데이터 개수 -1로 나눔.

=STDEV.S(B3:B22) : 표본표준편차. B3에서 B22에 있는 데이터의 표본표준편차. 표본분산의 제곱근.

=MIN(B3:B22) : 최소값. B3에서 B22에 있는 데이터 중에서 최소값을 표시함.

=MAX(B3:B22) : 최대값. B3에서 B22에 있는 데이터 중에서 최대값을 표시함.

=SQRT(D3) : 제곱근. D3값의 제곱근.

=ROUNDUP(SQRT(D3)) : 올림. D3값의 제곱근의 올림값.

=ROUND(M3/N3,2) : 반올림. M3값을 N3값으로 나눈 값을 반올림해서 소수점 2번째자리까지 표시.

=FREQUENCY(B3:B22,R3:R7) : 빈도수. B3에서 B22에 있는 데이터를 R3에서 R7까지의 구간에 맞춰 빈도수를 구함.


3.3. 실습강의

– 데이터

– 표본통계량

– 도수분포표

– 히스토그램

– 실습 안내


4. 참조

4.1 용어


히스토그램

데이터값의 분포를 표현하는 방식중의 하나입니다.  연속확률변수의 확률값을 막대그래프 모양으로 표현한 것입니다. Karl Pearson에 의해 처음 소개되었습니다.

히스토그램을 작성하려면 먼저 변수 범위를 구간(“bin”또는 “bucket”)으로 나눕니다. 그리고  각 구간에 몇 개의 데이터 값이 속하는 지를 정리합니다. 구간은 연속적이고 겹치지 않고 인접해야 하며 같은 간격이면 분석에 용이합니다.(구간 간격이 꼭 같아야 하는 것은 아닙니다.)

직사각형(막대)의 높이에 비례하는 빈도수는 상대빈도수로 정규화될 수 있습니다.  구간들이 동일한 간격이고 간격이 1인 경우, 빈도수를 정규화하게 되면 각 직사각형의 높이는 상대빈도수를 표현하는 확률이 되어 각 직사각형의 높이의 합은 1이 됩니다. 그러나 구간은 동일한 폭(구간크기)일 필요는 없습니다. 이 경우 직사각형(막대)은 구간의 빈도수에 비례하는 면적을 갖도록 정의됩니다 . 수직축은 빈도수가 아니라 빈도수밀도(수평축상의 변수의 단위당 경우의 수)입니다. 모양은 막대 그래프의 막대가 서로 인접한 모양으로 변수가 연속적으로 표현되었다는 것이 중요합니다.

 

히스토그램은 데이터의 기본 확률분포밀도를 대략적으로 나타내며, 확률밀도 추정시 자주 사용됩니다 . 즉, 기본 확률변수의 확률밀도함수를 나타냅니다 . 확률 밀도에 사용되는 히스토그램의 총 면적은 항상 1로 정규화됩니다. $X$ 축의 간격이 모두 1이면 히스토그램은 상대빈도 막대그래프와 동일합니다 . 히스토그램은 통계적 속성을 모델링해야 할 때 통계 패키지 프로그램에서 자주 쓰입니다. 예를 들면, 커널 밀도 추정치의 상관 관계 변이는 수학적으로 설명하기가 매우 어렵지만 각 구간이 독립적으로 변하는 히스토그램에서는 이해하기가 쉽습니다. 커널 밀도 추정의 대안은 평균 이동된 히스토그램입니다  계산 속도는 빠르며 커널을 사용하지 않고 밀도를 부드럽게 계산할 수 있습니다.

 

히스토그램은 때때로 막대그래프와 혼동됩니다.히스토그램은 연속 데이터에 사용되기 때문에 막대는 붙어 있게 됩니다.  그래서 구별을 분명히 하기 위해 막대그래프는 막대 사이에 간격을 줍니다.

 

Reference

Histogram – Wikipedia


 


막대그래프

막대그래프는 데이터값에 비례하는 길이를 가지는 직사각형 막대로 데이터값을 표현합니다. 막대그래프는 세로 또는 가로로 그릴 수 있습니다. 세로 막대그래프는 때로는 선 그래프와 같이 표현됩니다. 막대그래프는 각 범주간 데이터값을 잘 비교합니다. 그래프의 한 축은 비교할 특정 범주를 표시하고 다른 축은 측정된 데이터값을 길이로 나타냅니다. 막대 그래프를 응용하면 두 개 이상의 그룹으로 묶어서 막대를 나타낼 수 있으며 둘 이상의 측정 변수의 값을 비교하여 보여 줄 수 있습니다.

 

Reference

Bar chart – Wikipedia



4.2. 참고문헌


도수분포 막대그래프와 확률질량함수 ?
Frequency bar chart & pmf ?

1. 애니메이션

1.1. 도수분포 막대그래프


2. 설명

2.1. 도수분포 막대그래프


3. 실습

3.1. 구글시트

3.2. 구글시트 함수

3.3. 실습강의


4. 용어와 수식

4.1. 용어


1. 애니메이션



도수분포 막대그래프


2. 설명

2.1 도수분포 막대그래프

막대그래프(bar chart)는 독립변수에따라 변하는  종속변수의 값을 막대의 길이로 나타내는 그래프입니다.

독립변수를 X축, 종속변수를 Y축으로 하는 2차원 그래프입니다.

 

도수분포 막대그래프는 독립변수를 확률변수로 종속변수를 빈도수로 하는 막대그래프입니다.

즉, 빈도수를 막대의 길이로 나타내어 빈도수의 분포를 시각화한 그래프입니다.

 

도수를 영어로는 frequency라고 하며 도수분포도는 frequency distribution이라고 부릅니다.

 

도수분포표(frequency table)를 작성하는 것은 연속형 데이터를 구간에 따른 빈도수로 시각화하는 기초작업입니다.

연속형 데이터의 분석을 위해 우선  도수분포표를 만들고 그리고 나서 도수분포도를 그립니다.

 

도수분포표 작성에서 가장 중요한 것은 구간의 간격을 정하는 것입니다. 구간의 간격은 분석의 목적에 따라 결정됩니다. 구간의 간격이 결정되면 구간의 수가 자동으로 결정됩니다.


3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


도수분포 막대그래프

3.2. 구글시트 함수

=준비 중 입니다. 


3.3. 실습강의

데이터

도수분포표

도수분포 막대그래프



4. 용어와 수식

4.1 용어

상자그림 ?
Box plot ?

1. 애니메이션

1.1. 상자그림

1.2. 사분위표


2. 설명

2.1. 상자그림

2.2. 사분위표


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 참조

4.1. 용어

4.2. 참고문헌

1. 애니메이션



상자그림




사분위표

2. 설명

2.1. 상자그림(box plot)

상자그림(box plot)은 데이터값의 분포를 나타내는 시각화 방법으로 널리 사용되고 있습니다. 데이터의 대표값으로 평균을 사용하는 확률분포함수(확률밀도함수 또는 확률질량함수)와는 다르게 상자그림은 데이터의 대표값으로 중앙값을 표시합니다. 그리고 상자그림의 각 상자에는 같은 개수의 데이터가 들어가게 됩니다.

상자그림은 사분위표를 먼저 작성하면 쉽게 그릴수 있습니다. 상자그림은 가로 또는 세로로 그릴 수 있습니다. 상자그림은 도수분포 히스토그램과 달리 평균이나 분산같은 모수(parameter)를 가지지 않습니다.

딸기 20개의 당도를 측정한 후 상자그림을 그려보겠습니다. 20개의 당도를 내림차순으로 가장 큰 값부터 작은 값 순으로 배열합니다. 당도는 12.24에서 10.68까지 분포되어있습니다. 당도의 중앙값은 11.71입니다. 중앙값은 두 개의 상자를 나누는 선으로 표시됩니다. 두 개의 상자의 범위는 각각 25%의 데이터 개수를  가집니다. 당도의 1사분위수는 11.16이고 3사분위수는 11.89입니다. 2사분위수와 3사분위수는 상자의 끝선으로 나타냅니다. 최대값은 12.24이고 최소값은 10.68 입니다. 최대값과 최소값은 상자와 이어진 선으로 표현합니다.


2.2 사분위표

사분위표는 데이터를 표현하는 한 방법입니다. 사분위표는 데이터를 순서대로 늘어놓고 같은 개수를 가지는 4개의 집단으로 나누어  놓은 표입니다. 사분위수는 이 4개 집단의 최대값으로 표시할 수도 있고, 4개 집단의 경계에 있는 값들의 평균 혹은 중앙값으로 표시할 수도 있습니다.

유사하게 백분위표는 데이터를 순서대로 늘어놓고 같은 개수를 가지는 100개의 집단으로 나누어  놓은 표입니다. 이 때 100개의 집단의 최대값이 백분위수(percentile)입니다. 백분위수는 %를 단위로 사용합니다. 예를 들어,  p%로 표현되는 백분위수(percentile)는 데이터를 작은 것부터 큰 것까지 순서대로 늘어놓고 같은 개수를 가지는 100개의 집단으로 구분하였을 때  p번째 집단의 최대값을 뜻합니다. 데이터개수가 100보다 적을 경우에는 한 데이터가 여러 개의 백분위 집단에 해당되도록 하여 백분위표를 만들 수도 있습니다.

사분위수(quartile)는 백분위수로 표현할 수 있습니다.

1사분위수(Q1)는 데이터의 25%가 이 값보다 작거나 같습니다.

2사분위수(Q2)는 데이터의 50%가 이 값보다 작거나 같습니다.

3사분위수(Q3)는 데이터의 75%가 이 값보다 작거나 같습니다.

정리하면, 백분위수 중 25% 백분위수를 1사분위수(1st quartile, Q1), 50% 백분위수를 2사분위수(2nd quartile, Q2) 또는 중앙값(median), 75% 백분위수를 3사분위수(3rd quartile, Q3)라고 부릅니다.

4분위수범위(interquartile range)는 3사분위수에서 1사분위수를 뺀 값 입니다. 즉, 데이터의 중앙부 50%의 범위입니다. 4분위수범위는 IQR로 표현합니다.

$$IQR={Q_3} – {Q_1}$$

아주 크거나 작은 데이터(변수값)가 있는 경우, 범위(Range)는 왜곡이 발생합니다. 이 때는 범위(Range)대신에 4분위수범위(IQR)을 사용할 수 있습니다.

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


상자그림 : 구글시트 실습

3.2. 함수

=SORT(C3:C22,1,TRUE) : 데이터정렬. C3와 C22 범위에 있는 데이터를 1(첫)번째 열을 기준으로 오름차순(TRUE)으로 정렬. TRUE 대신 FALSE를 넣으면 내림차순으로 정렬.


3.3. 실습강의

– 데이터

– 데이터 정렬

– 최소값, 최대값, 중앙값, 사분위수

– 상자그림

– 실습 안내


4. 참조

4.1 용어


상자그림

상자그림(Box plot)은 4분위수를 통해 데이터를 그래픽으로 묘사하는 방법입니다. 최대값과 최소값으로 표현되는 데이터의 범위를 나타내는 선이 보입니다. 특이값은 개별 점으로 표시 할 수 있습니다. 상자그림은 도수분포 히스토그램과 달리 모수(파라미터)를 가지지 않습니다. 특정 분포를 나타내지 않고 데이터의 분포를 표시합니다 (상자그림은 상자의 대칭 및 길이로 정규성을 나타낼 수도 있음). 상자의 간격과 상자에 붙어있는 선의 길이는 데이터의 분산 정도를 나타내고  점들은 이상값을 나타냅니다. 특히 4분위수, 범위, 중앙값을 시각적으로 나타낼 수 있습니다. 상자그림은 가로 또는 세로로 그릴 수 있습니다.

Reference

Box plot – Wikipedia


4.2. 참고문헌


Reference

Wikipedia

자연상수 ?
Euler’s number ?

1. 애니메이션

1.1. Natural exponential    $y=e^x$

1.2. Gaussian function    $y=e^{-x^2}$


2. 설명

2.1. 복제와 자연상수

2.2. 붕괴와 자연상수

2.3. 재귀식과 자연상수

2.4. 미분방정식과 자연상수

2.5. 지수함수와 자연상수

2.6. 자연상수 성질

2.7. 자연상수 시각화

2.8. 자연상수 적용


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 용어

4.1. 용어

4.2. 참조

1. 애니메이션



Natural exponential    $y=e^x$




Gaussian function    $y=e^{-x^2}$

2. 설명

2.1. 복제(複製)와 자연상수

은행A는 예금자와 합의한 기간 동안 예금액을 복제해주는(2배로 불려 주는) 은행입니다. 다르게 표현하면 예금액에 더해 예금액과 같은 금액의 이자를 주는 은행입니다. 

$$Y=I+I\dfrac{T}{T}=2I$$

여기서 $Y$는 출금액

$I$는 예금액

$T$는 합의한 기간

예를 들어, 예금자와 은행이 합의한 예치기간을 1년으로하고 에금액을 1억으로 하면 합의한 기간인 1년 후에 예금자는 예금액의 2배인 2억을 출금할 수 있습니다. 다르게 표현하면 예금액 1억과 불려진 금액(이자)인 1억의 합이 출금액 2억원이 됩니다.

$$Y=1+1\dfrac{1}{1}=2 \,\, \text{억원}$$

은행B는 은행A와 마찬가지로 합의된 기간 동안 예금액을 2배로 불려주는데, 은행A와 다른 점은 합의된 예치기간내라도 출금을 할 수 있고 출금시 원금과 예치기간에 비례한 이자를 주는 은행입니다.

$$Y=I+I\dfrac{t}{T}$$

여기서 $Y$는 출금액

$I$는 예금액

$T$는 합의한 기간

$t$는 예치한 기간 ; $t  ≤ T$

예를 들어, 예금자와 은행이 합의한 예치기간을 1년으로 하고 1억을 예금하고 반년 후에 출금하면 예금 1억과 이자 0.5억원을 받습니다. 이를 다시 남은 반년간 예치하면 입금 1.5억과 이자 0.75억원을 받습니다. 정리하면, 합의한 기간을 반으로 나누어 입금과 출금을 연속적으로 진행하면 합의한 기간인 1년 후에 2.25억원을 받습니다.

$$Y=\left(1+1\cdot\dfrac{1}{2}\right) +\left(1+1\cdot\dfrac{1}{2}\right)\dfrac{1}{2}=\left(1+1\cdot\dfrac{1}{2}\right)^2 \text{억원}$$

위식을 일반화하면

$$Y=\left(I+I\cdot\dfrac{1}{n}\right)^n$$

여기서,  $Y$는 합의기간 후의 출금액

$I$는 처음 입금액

$n$은 1기간(표준화된 합의기간) 동안 “입금하고 출금하기” 회수

위 두가지 결과로 추론하면 예금자는 은행B를 선택하고 입금과 출금을 많이 하면 할수록 합의된 기간이 지난 후 더 많은 금액을 받을 수 있습니다. 또한, 입금과 출금을 연속적으로 반복하면 합의된 기간 후의 출금액은 수렴하며 최대출금액이 됩니다. 이를 다음식과 같이 일반화할 수 있습니다.  첫 입금액($I$)가 1이고 합의한 기간을 1로하면 출금액은 수렴하는 데 이 수렴값을 자연상수(Euler’s number, natural constant, $e$)라고 합니다. 자연상수($e$)는 무리수이며 정수, 2와 반복하지 않는 무한소수,  $0.718\cdots$의 합입니다.

$$Y=\lim_{n \to \infty} (I+I\cdot\dfrac{1}{n})^n=I^n e$$

여기서 $Y$는 합의기간 후 출금액

$I$는 처음 입금액

$n$은 “입금하고 출금하기” 횟수

위의 결과를 종합하면 정해진 1단위금액을 합의된 1단위시간동안 복제하는(2배로 만들어 주는) 은행이 있다면 1단위시간동안 입출금을 무한번 반복하면 1단위시간 후의 출금액은 수렴하며 가능한 최대출금액이 됩니다.


2.2. 붕괴(崩壞, decay)와 자연상수

방사성물질 A는 일정기간이 지나면 붕괴하는(질량이 반으로 주는) 물질입니다.

$$Y=I-\dfrac{I}{2}\dfrac{T}{T}=\dfrac{1}{2}I$$

여기서 $Y$는 반감기가 지난 후의 질량

$I$는 처음 질량

$T$는 반감기

예를 들어, 방사성물질 A가 반감기가 1년이고 처음 질량을 1g으로 하면 1년 후에 질량은 $\dfrac{1}{2}\mathrm{g}$이 됩니다.

$$Y=1-\dfrac{1}{2} \times \dfrac{1}{1}=\dfrac{1}{2}\mathrm{g}$$

방사성물질A가 연속적으로 붕괴하도록 하는 환경이 조성된다면 방사성물질A의 질량은 다음식으로 표현할 수 있습니다.

$$Y=\left(I-I\cdot\dfrac{1}{n}\right)^n$$

여기서 $Y$는 반감기가 지난 후의 질량

$I$는 처음 질량

$n$은 1기간(반감기) 동안 붕괴회수

붕괴회수를 극대화하면 다음과 같습니다.

$$Y=\lim_{n \to \infty} (I-I\cdot\dfrac{1}{n})^n=I^n e^{-1}$$

여기서 $Y$는 남은 질량

$I$는 처음질량 : $I$가 1이면 $Y$는 $e$로 수렴

$n$은 붕괴회수

위의 결과를 종합하면 처음 질량이 일정기간 동안 반이 되는 방사성원소가 있다면 그 기간동안 붕괴를 연속적으로 진행하면 붕괴 후의 질량은 수렴합니다. 이 때의 수렴된 값의 역수를 자연상수라 합니다. 자연상수는 무리수이며 $2.718\cdots$입니다.


2.3. 재귀식(recursive formula)과 자연상수

팩토리얼(factorial)은 다음과 같이 정의됩니다.

$$n!=n\times(n-1)\times, \ldots , \times 1$$

여기서, $n$은 0과 자연수이며 $0!=1$ 이고 $1!=1$

팩토리얼을 재귀식(recursive formula)으로 표현하면 다음과 같습니다.

$$f(0)=1$$

$$f(n)=n \times f(n-1) \,\, \text{for} \,\, n \gt 0$$

자연상수를 재귀식으로 표현하면 다음과 같고 $n$이 증가하면 자연상수에 가까워집니다.

$$e(0)=1$$

$$e(n)=e(n-1) \times \dfrac{1}{f(n)} \,\, \text{for} \,\, n \gt 0$$

자연상수를 무한급수형태의 재귀함수로 표현하면 다음과 같습니다.

$$e=\sum\limits_{n=0}^{n=\infty}\dfrac{1}{n!}$$


2.3. 미분방정식과 자연상수

다음 미분방정식은 미분값이 값의 배수와 같음을 나타내는 방정식입니다. 즉, $x$에 대한 $y$의 변화율이 $y$자신에 비례하는 모델입니다. 이러한 유형의 방정식은 자연 세계에서 많이 발견되며, 예를 들어 방사성붕괴나 인구성장 모델이 있습니다.

$$\dfrac{dy}{dx}=ky$$

여기서, $y$는 종속변수

$x$는 독립변수

$k$는 상수

이 미분방정식을 만족시키는 함수는 다음과 같습니다

$$y=Ce^{kx}$$

여기서, $e$는 자연상수

$C$는 초기 조건에 따라 결정되는 상수

$k$는 상수

자연상수는 이러한 유형의 미분방정식을 만족하는 지수함수에서 나타나며, 지수적 성장이나 감소를 모델링하는 데 중요한 역할을 합니다.


2.4. 지수함수와 자연상수

자신을 $x$번 곱해도 자신이 되는 수를 1로 정의하며 지수함수의 밑의 기준이 됩니다. 

$$1^x = 1$$

모든 실수는 자신을 0번 곱하는 것을 1로 정의하며 0은 지수함수의 지수의 기준이 됩니다.

$$a^0 \equiv 1$$

지수함수는 다음과 같이 표현합니다.

$$y=f(x)=a^x$$

여기서, $a$는 양의 실수

$x$가 0일 때의 $x$에 대한 $y$의 변화율(기울기)을 표현하면

$$f^{\prime}(0)=\lim\limits_{\Delta x \to 0}\dfrac{a^{0+\Delta x}-a^0}{\Delta x}=\lim\limits_{\Delta x \to 0}\dfrac{a^0(a^{\Delta x}-1)}{\Delta x}=a^0\left(\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}\right)=\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}$$

여기서,  $\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}$는 수렴

$a=2$이면 $\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}=0.6931472\cdots$

$a=3$이면 $\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}=1.0986123\cdots$

$f^{\prime}(0)=a^0\cdot \ln a=1$일 때의 $a$를 구하면 $a$는 $2.718\cdots$인 무리수이며 이를 자연상수 $e$라고 합니다.

$$\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}=1$$

여기서,  $a$는 $2.718\cdots$인 무리수이며 자연상수

지수함수의 미분함수(도함수)를 일반화하면

$$f^{\prime}(x)=\lim\limits_{\Delta x \to 0}\dfrac{a^{x+\Delta x}-a^x}{\Delta x}=\lim\limits_{\Delta x \to 0}\dfrac{a^x(a^{\Delta x}-1)}{\Delta x}=f(x)\left(\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}\right)=f(x)g(a)$$

여기서, $a^{x+\Delta x}=a^{x} a^{\Delta x}$

$0 < a$

$g(a)$는 $\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}$이며 $a$에 따라 다른 값으로 수렴하는 함수


2.5. 자연상수 (Natural constant, $e$) 성질

자신을 $x$번 곱해서 나오는 값이 $x$에서의 기울기인 수가 자연상수 $e$입니다. 자연상수($e=2.718\cdots$)는 무리수입니다. $e$를 $x$번 곱해서 나오는 값인  $e^x$을 두 변수, $x$와 $y$가 이루는 직교좌표계에서 함수로 표현하면

$$y=f(x)=e^x$$

원함수를 미분하여 표현하면

$$\dfrac{dy}{dx}=f^{\prime}(x) =\dfrac{d(e^x)}{dx} = e^x$$

원함수를 적분하여 표현하면

$$\int ydx=F(x)=\int_{-\infty}^{x}e^tdt= e^x$$

여기서,  $\lim\limits_{x \to -\infty} e^x=0$

원함수와 미분함수와 적분함수가 모두 같습니다. 모두 자연상수가 밑이 되는 지수함수입니다. 자연상수를 밑으로 하는 지수함수, 즉, 자연 지수함수는 정의역에 따라 다음과 같이 표현할 수 있습니다.

$$f(x)=e^x$$

여기서,  $x < 0$ 이면  $f(x)=\left(\dfrac{1}{e}\right)^{ㅣxㅣ}$

$x = 0 $ 이면  $f(x)= 1$

$x > 0$ 이면  $f(x)=e^x$

단위기간을 나눈 무한횟수($n$)로 표현하면

$$e=\lim_{n \to \infty} \left(1+{\dfrac {1}{n}}\right)^{n}$$

단위기간의 나누어진 극소시간($t$)로 표현하면

$$e=\lim_{t \to 0} \left(1+t\right)^{\frac{1}{t}}=e$$

자연상수를 급수(series)로 표현하면

$$\eqalign{e=\sum_{n=0}^{\infty}\dfrac{1}{n!} &= \dfrac{1}{0!} + \dfrac{1}{1!} + \dfrac{1}{2!} + \dfrac{1}{3!} + \cdots \cr&= \dfrac{1}{1} + \dfrac{1}{1} + \dfrac{1}{1\cdot 2} + \dfrac{1}{1\cdot 2\cdot 3} + \cdots}$$

자연로그와의 관계는 

$${\rm ln}\left(e^x\right) = x \,\, , \,\, e^{{\rm ln} (x)} = x$$

가우스 적분

$$\int_{-\infty}^{\infty}e^{-x^2}dx=\sqrt{\pi}$$

임의의 가우스적분(arbitrary Gaussian function)

$$\int _{-\infty }^{\infty }e^{-a(x+b)^{2}}\,dx=\sqrt {\dfrac {\pi }{a}}$$

베르누이 시행

$$\binom {n}{k}\left({\dfrac {1}{n}}\right)^{k}\left(1-{\dfrac {1}{n}}\right)^{n-k}$$

베르누이 시행에서 $k$가 0이고 $n$이 무한대이면

$$\lim\limits_{n \to \infty} \left(1-{\dfrac {1}{n}}\right)^{n}=\dfrac{1}{e}$$

로그함수 미분

$$\dfrac {d}{dt}\log _{e}t=\dfrac {1}{t}$$

로그함수 적분

$$\int _{1}^{e}{\dfrac {1}{t}}\,dt=1$$

자연 지수함수의 생성상수가 $\tau$일 때

$$\tau =\dfrac{f(t)}{f'(t)}$$

$$f(t+\tau )=ef(t)$$


2.6. 자연상수 시각화

극좌표계

극좌표계에서 원점에서의 거리, $r$이 시간($t$)에 따라 지수함수적으로 작아지고 각속도($\dot{\theta}$)가 상수인 $2\pi$로 등속일 때 2차원 평면에서 점의 움직임을 수식으로 표현하면 다음과 같습니다.

$$\dfrac{dr}{dt}= \left(\dfrac{1}{e}\right)^t$$

여기서, 시간($t$)는 0에서 시작하여 커지는 실수

점의 각속도

$$\dfrac{d\theta}{dt}=2\pi$$

여기서, 시간($t$)는 0에서 시작하여 커지는 실수. 그리고 $\theta$는 직각좌표계의 $x$축 방향에서 시작

직각좌표계

점의 $x$축에서의 출현 횟수는 단위시간 1당 1번

$$\dfrac{dl}{dt}=2{\pi}e^t$$

여기서,  $\dfrac{dl}{dt}=2{\pi}\dfrac{dr}{dt}$

모든 각도에서 점이 무한대로 있고 운동하면


2.7. 자연상수 적용

복리 적금

리 적금의 원금과 이자의 합계(원리 합계)는 다음의 식과 같이 계산할 수 있습니다.

 

원리합계 = 원금 × (1 + 이자율)기간

 

원리합계는 원금과 이자율과 기간이 결정한다는 것을 알 수 있습니다. 기간이 무한하게 커져도 원리합계가 수렴하는 경우는 이자율과 기간이 서로 반 비례하는 경우입니다. 

미분방정식으로 표현하면

$$\dfrac{dM}{dt}=(1+r)M$$

여기서,  $M$은 $t$의 함수이며 $M(t)$는 $t$시간이 흐른 후 찾을 수 있는 금액

$r$은 이자율

미분방정식을 풀면

$$M(t)=e^{(1+r)t}$$

여기서,  $M$은 $t$의 함수이며 $M(t)$는 $t$시간이 흐른 후 찾을 수 있는 금액

$r$은 이자율

자기복제

우선, 이산적(discrete)인 경우의 자기복제를 생각해 봅니다. 초기량를 1이라 하고 단위 복제 기간을 1이라고 한다면 1기간 후에는 자신의 초기량의 2배인 2가 됩니다.  복제가 연속적(continuous)으로 진행되는 경우는 복제가 진행되는 기간을 1 이라고 한다면 1기간 후에는 다음식과 같이 총량이 만들어 집니다.  총량은 초기량과 복제된 량의 합입니다.

 

$$\mathop{\lim}\limits_{{t}\rightarrow{o}}{\left({{1}{+}{t}}\right)}^{\frac{1}{t}}{=}\mathop{\lim}\limits_{{n}\rightarrow\infty}{\left({{1}{+}\frac{1}{n}}\right)}^{n}$$

 

이 값의 최대값은 단위 1기간을 무한개의 기간으로 나누면  $e$로 수렴합니다.

 

$$\mathop{\lim}\limits_{{t}\rightarrow{o}}{\left({{1}{+}{t}}\right)}^{\frac{1}{t}}{=}\mathop{\lim}\limits_{{n}\rightarrow\infty}{\left({{1}{+}\frac{1}{n}}\right)}^{n}=e$$

 

정리하면, 크기 1이 1기간 동안 생성률(미분계수) 1로 시작하여  무한 자기복제를 하면 수렴하게 되는데  그 값이 자연상수($e$)입니다. 자연상수($e$)는 무리수 입니다. 

 

$e = 2.71828…$

 

$${e}{=}\mathop{\lim}\limits_{{t}\rightarrow{o}}{\left({{1}{+}{t}}\right)}^{\frac{1}{t}}{=}\mathop{\lim}\limits_{{n}\rightarrow\infty}{\left({{1}{+}\frac{1}{n}}\right)}^{n}$$

온도평형

방안의 온도와 방안에 있는 찻잔 속의 뜨거운 물의 온도차이를 $\Delta T$라 하면 온도차이의 시간이 지남에 따라 줄어드는 속도는 온도차이에 비례합니다.

$$\dfrac{d\Delta T}{dt}=-k\Delta T$$

여기서,  $\Delta T$는 방안의 온도와 뜨거운 물의 온도차

자연에서 온도차($\Delta T$)는 다음식과 같이 관찰됩니다.

$$f^{\prime}(t)= -k f(t)$$

여기서, $f(t)=\Delta T$

$t$는 시간

$k$는 주어지는 상수

위의 함수  $f(t)$를 지수함수($a^t$)로 모델링할 수 있습니다.

$$f^{\prime}(t)=\lim\limits_{\Delta t \to 0}\dfrac{a^{t+\Delta t}-a^t}{\Delta t}=\lim\limits_{\Delta t \to 0}\dfrac{a^x(a^{\Delta t}-1)}{\Delta t}=f(t)\left(\lim\limits_{\Delta t \to 0}\dfrac{a^{\Delta t}-1}{\Delta t}\right)=-kf(t)$$

여기서,  $0<a≤1$

$k=-\lim\limits_{\Delta t \to 0}\dfrac{a^{\Delta t}-1}{\Delta t}$이며 $a$에 대한 함수

 $a$를 $e^{\ln a}$로 대치하면

$$f(t)=\Delta T(t)=e^{-kt}$$

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


생성단위 자연상수 e : 구글시트 실습

3.2. 구글시트 함수

=EXP(1) : 자연상수 e의 거듭제곱. 괄호안의 숫자는 거듭제곱할 지수. 

=FACT(A3) : 계승. A3에 있는 값보다 작거나 같은 모든 양의 정수의 곱. 예를 들어, A3가 3이라면, 3의 계승은 3, 2, 1의 곱, 즉, $(3\times 2\times 1)$이 됨.

=2^2 : 거듭제곱. 2를 2번 곱함.

=LN(2) : 자연로그. 자연상수 e를 밑으로 하는 자연로그 값. e를 몇 제곱해야 2가 되는지 계산함. 따라서, =LN(EXP(1))의 값은 1이 됨.


3.3. 실습강의

자연상수 e

구글시트 함수로 e 구하기

복리계산식으로 e 구하기

베르누이의 공식으로 e 구하기

테일러 전개로 e 구하기

지수함수

실습 안내


4. 용어

4.1 용어


e (자연상수, mathematical constant)

오일러 수(Euler’s number)라고도 하는 상수 $e$는 대략 2.71828과 같은 수학적 상수로 여러 측면에서 규정될 수 있습니다. 자연로그의 밑입니다. $n$이 무한대에 가까워질 때의  $(1 + \dfrac{1}{n})^n$의 극한값입니다. 복리계산에서 보이는 표현입니다. 무한급수의 합으로 계산할 수도 있습니다.

 

또한 $e$는 함수 $y = ax$의 그래프가 $x = 0$에서 기울기가 1이 되도록 하는 고유한 양의 상수입니다. (자연)지수 함수 $f(x) = e^x$는 고유한 함수 $f$가 도함수와 동일하고 방정식 $f(0) = 1$을 충족합니다. 따라서 $e$를 $f(1)$로 정의할 수도 있습니다. 자연로그 또는 밑이 e인 로그는 자연 지수 함수의 역함수입니다. 숫자$k > 1$의 자연로그는 $x = 1$과 $x = k$사이의 곡선 $y = \dfrac{1}{x}$ 아래의 면적으로 직접 정의할 수 있습니다. 이 경우 $e$는 이 면적이 1일 때의  $k$의 값입니다.

 

상수 $e$는 수학자 Leonhard Euler의 이름을 따서 Euler’s number 또는 John Napier의 이름에서 Napier의 상수라고 합니다. 이 상수는 복리를 연구하던 중 스위스 수학자 Jacob Bernoulli가 발견했습니다. 상수 $e$는 $0$, $1$, $\pi$ 및 $i$와 함께 수학에서 매우 중요한 수입니다. 숫자 5개 모두 오일러의 항등식 $e^{i\pi }+1=0$에 나타나며 수학 전반에 걸쳐 사용됩니다. 상수 ${\pi}$와 마찬가지로 $e$는 무리수(정수 비율로 나타낼 수 없음)이고 초월적(유리계수가 있는 0이 아닌 다항식의 근이 아님)수입니다. 소수점 이하 50자리까지 $e$의 값은 다음과 같습니다.

2.71828182845904523536028747135266249775724709369995…

 

Reference

e (mathematical constant)


Product Integral

  additive multiplicative
discreate $$\sum_{i=a}^{b}f(i)$$ $$\prod_{i=a}^{b}f(i)$$
continuous $$\int_{a}^{b}f(x)dx$$ $$\prod_{a}^{b}f(x)^{dx}$$

곱의 적분(product integral)은 미적분학의 일반적인 합의 적분과 상대되는 적분입니다. 곱의  적분은 1887년 수학자 Vito Volterra가 선형 미분 방정식 시스템을 풀기 위해 개발했습니다. 곱의 적분은 유행병학, 통계역학, 양자역학에 이르는 영역에서 사용됩니다. Geometirc 적분은  Geometric 도함수와 함께 이미지 분석 및 성장(growth)/쇠퇴(decay) 현상(예: 경제 성장, 박테리아 성장 및 방사성 붕괴) 연구에 유용합니다.Bigeometric 적분은 Bigeometric  도함수와 함께 프랙탈의 일부 응용과 경제학의 탄력성 이론에서 사용합니다.

 

Reference

Product integral – Wikpedia


Gausian Integral

오일러-푸아송 적분으로도 알려진 가우시안 적분은 가우시안 함수인 $f(x)=e^{-x^{2}}$의 실수에서의 적분입니다. 이 적분은 독일 수학자 칼 프리드리히 가우스의 이름을 따서 명명되었습니다.

$$\int _{-\infty }^{\infty }e^{-x^{2}}\,dx=\sqrt {\pi}$$

Abraham de Moivre는 1733년에 이러한 유형의 적분을 발견했으며, Gauss는 1809년에 이 적분을 발표했습니다. 이 적분에는 광범위한 응용 분야가 있습니다. 예를 들어, 약간의 변수 변경으로 정규 분포의 정규화 상수를 계산하는 데 사용됩니다. 정적분은 정규분포와 누적분포함수의 오류함수와 밀접한 관련이 있습니다. 예를 들어, 물리학에서 이러한 적분은 양자역학에서 조화 발진기의 기저 상태의 확률 밀도를 표현할 때 나타납니다. 이 적분은 또한 경로 적분 공식에서 고조파 발진기의 전파자를 찾기 위해, 그리고 통계역학에서 분할함수를 찾을 때 사용됩니다. 임의의 가우스 함수의 정적분은 다음과 같습니다.

$$\int _{-\infty }^{\infty }e^{-a(x+b)^{2}}\,dx=\sqrt {\dfrac {\pi }{a}}$$

Reference

Gaussian integral – Wikipedia


원주율(π) ?

1. 애니메이션

1.1. 회전단위 원주율


2. 설명

2.1. 회전단위 원주율

2.2. 확률분포에서의 원주율


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 용어

4.1. 용어

4.2. 참조

1. 애니메이션



회전단위 원주율 파이(pi, π)

2. 설명

2.1. 회전단위 원주율

원주율($\pi$)

원주(원의 둘레, circumference)와 지름(diameter)의 비는 항상 일정합니다. 또한 원의 면적과 반지름(radius)의 제곱의 비도 항상 일정합니다. 그 비를 원주율이라고 부르며 상수입니다. 원주율은 그리스문자, $\pi$(pi)로 표기합니다. $\pi$는 무리수이며 십진법으로 표현하면, 정수인 3과 반복하지 않는 무한소수(無限小數, infinite decimal)인 0.141592..의 합입니다. 원주의 길이는 지름의 길이의 3배에서 4배사이라고 고대부터 알고 있었습니다. 이 지식은 수레바퀴의 회전수로 수레가 이동한 거리를 구할 때 사용하였습니다.

 

원주율($\pi$)은

$$\pi=\dfrac{l}{2r}$$

여기서,  $l$은 원주

$r$은 원의 반지름

원주($l$)는

$$l=2\pi r$$

여기서,  $l$은 원주

$\pi$는 원주율

$r$은 원의 반지름

지름 1인 원의 원주는 $\pi$이고 반지름이 1인 원의 원주는 $2\pi$입니다.

각도의 단위 : radian(라디안)

호(arc)는 원주(원의 둘레, circumference)의 일부분으로, 원주상의 두 점 사이 곡선입니다. 호는 원주상의 두 점과 원(circle)의 중심에 의해 정의됩니다. 이 두 점은 호의 끝점이라고 하며, 원의 중심에서 이 두 점을 잇는 선분들은 각도(angle)를 형성합니다. 호의 길이는 원의 반지름과 중심각(호를 둘러싸는 각도)에 의해 결정됩니다. radian은 호(원주의 부분, arc)를 반지름으로 표준화한 값이며 각도를 표현할 수 있습니다.

$$\text{radian}=\dfrac{a}{r}$$

여기서,  $a$은 호(arc)

$r$은 원의 반지름

1 radian은 호(각도가 차지하는 원주)와 반지름의 길이가 같을 때 값입니다. radian은 각도의 단위로 사용되며 rad로 표기합니다. 중심각이 라디안 단위로 주어진 경우, 호의 길이는 반지름과 중심각의 곱입니다. 예를 들어, 반지름이 $r$이고 중심각이 $\theta$ rad인 원의 호의 길이는 $r\cdot\theta$입니다. 원주를 이루는 모든 점의 회전각을 모두 더하면 한 회전이 됩니다. 그리고 호의 radian은 호를 이루는 점들의 회전의 적분값이라고 할 수 있습니다.

각속도의 단위

회전(rotation)은 점의 방향이 변하여 처음과 같은 방향으로 돌아오는 것을 말합니다. 한 회전의 각도는 2$\pi$ rad 입니다.

$$\text{1회전}=2\pi \mathrm{rad}$$

회전량의 단위는 각도의 단위와 같으며 1회전을 360진법으로 나타내는 degree(도)와 2$\pi$ 로 나타내는 radian이 있습니다. 360 degree는 2$\pi$ rad에 해당합니다. 회전속도(각속도)의 단위는 rad/sec입니다. $\pi$와 각도의 단위, radian은 회전의 속도인 주파수에 사용됩니다. 예를 들면, 1초 동안 한 번 회전하면 2$\pi$ rad/sec입니다. 한편, 1초 동안 1번 회전하면 1 Hz(헤르츠)입니다.  따라서 2$\pi$ rad/sec는 1Hz입니다.


2.2. 확률분포에서의 원주율($\pi$)

확률모델에서는 개체를 점(point)으로 표현합니다. 개체의 속성을 확률변수로 하여 생성되는 점의 위치를 확률변수값으로 모델링합니다. 그리고 속성이 출현하는 빈도의 비를 확률로 표현하는 데 그 위치에서의 회전속도로 모델링합니다. 개체의 속성이 이산적인 경우는 그 위치에서의 점의 회전속도를 확률질량으로 모델링하고 개체의 속성이 연속형인 경우에는 확률밀도로 모델링합니다. 다르게 표현하면 확률모델에서는 확률변수(위치)에서의 개체(object)의 출현주기의 비(확률질량비 또는 확률밀도 비)는 각 위치에서의 회전속도와 비례한다는 모델을 만들 수 있습니다. 한편, 통계모델에서는 개체를 표집(sampling)하는 주기(sampling frequency)가 개체가 생성되는 주기와 같다고 모델링할 수 있습니다.

원주로 표현되는 기하학적인 양

원의 반지름 원의 지름 원의 둘레 원의 면적 구의 표면적 구의 체적
$r$ $2r$ $2\pi r$ $\pi r^2$ $4\pi r^2$ $\frac{4}{3}\pi r^3$

원형균등분포(circular uniform distribution)

총 확률질량 1을 원의 면적으로 모델링합니다. 평균은 원의 중심점의 위치입니다. 원형균등분포에서 각 점의 확률밀도는 원의 면적에 반비례합니다. 따라서 확률밀도함수는 다음과 같습니다.

$$f(r, \theta)=\dfrac{1}{\pi R^2}$$

여기서, $r$은 반지름이며 실수인 연속형 확률변수

$\theta$는 각도이며 실수인 연속형 확률변수

$R$은 반지름이며 실수인 주어진 값(상수)

지지집합(support)인 확률이 존재하는 구간은 $0 \leq R$ 이고 $0 \leq \theta \lt 2\pi$

분산이 1인 2차 원형균등분포(circular uniform distribution)

2차원 원형균등분포의 경우, 서로 독립인 $x$축(가로축)과 $y$축(세로축)에 대한 분산은 $\left(\dfrac{1}{2}r\right)^2$입니다. 따라서 분산이 1이 되려면 $r$은 2가 되어야 합니다. 확률밀도함수는 다음과 같습니다.

$$f(x, y)=\dfrac{1}{4\pi}$$

지지집합(support)인 확률이 존재하는 구간은 $x^2+y^2 \leq 2^2$을 만족하는 $(x, y)$ 

1차원 표준정규분포

1차원 표준정규분포에서 원주율($\pi$)은 확률밀도함수(probability density function, pdf)에서 정규화 요소 $\sqrt{2\pi}$에 포함되어 있습니다. 정규화요소는 확률밀도함수를 확률변수의 모든 실수에 대해 적분했을 때 그 결과가 1이 되도록 보장합니다. 1차원 표준정규분포의 확률밀도함수(pdf)는 다음과 같습니다. 

여기서, $x$는 확률변수

는 자연상수

는 원주율

2차원 표준정규분포

2차원 표준정규분포는 두 독립적인 1차원 표준정규분포의 곱으로 표현될 수 있습니다. 2차원 표준정규분포에서 원주율($\pi$)은 확률밀도함수(probability density function, pdf)에서 정규화 요소 ${2\pi}$에 포함되어 있습니다. 정규화요소는 확률밀도함수를 두 확률변수의 모든 실수에 대해 적분했을 때 그 결과가 1이 되도록 보장합니다. 2차원 표준정규분포의 확률밀도함수(pdf)는 다음과 같습니다. 

여기서, $x$와 $y$는 서로 독립인 확률변수

는 자연상수

는 원주율

$x^2+y^2$은 $r^2$

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.



3.2. 구글시트 함수

=PI() : 파이(pi) 값. 소수점 이하 14자리까지의 파이(pi)값을 표시.

=RADIANS(180/100) : 360도 중 도 단위를 라디안으로 변환. 180/100, 즉 1.8도를 라디안으로 변환.

=SIN(RADIANS(180/100)) : 라디안으로 입력된 각도의 사인. 180/100, 즉 1.8도를 라디안으로 변환 후, 사인값을 표시.

=SUM(C:C) : 합계. C열에 있는 모든 데이터의 합계를 표시.

=SQRT(6*SUM(C:C)) : 제곱근. C열에 있는 모든 데이터를 더한 값에 6을 곱한 후, 제곱근을 구함.


3.3. 실습강의

파이(pi, π)

구글시트 함수로 파이 구하기

정사각형의 둘레로 파이 구하기

라이프니츠의 공식으로 파이 구하기

오일러의 곱셉 공식으로 파이 구하기

실습 안내


4. 용어

4.1 용어


원주율

숫자에서 무리수인 π(원주율, 파이로 읽음)는 원의 둘레($l$)와 지름($r$)의 비율인 수학 상수로 대략 $3.14159\cdots$와 같습니다. 무리수 π는 수학과 물리학 전반에 걸쳐 많은 공식에 나타납니다. 22/7과 같은 분수로 일반적으로 근사화하여 사용하지만 이는 무리수입니다. 즉, 두 정수의 비율로 정확하게 표현할 수 없습니다. 결과적으로 십진수로 표현할 때 자리수가 끝나지 않고 영구적으로 반복되는 패턴입니다. 원주율은 초월수로서 합, 곱, 거듭제곱, 정수만을 포함하는 방정식의 해가 될 수 없음을 의미합니다. π의 초월은 나침반과 직선자로 원을 제곱하는 고대의 과제를 해결하는 것이 불가능하다는 것을 의미합니다. π의 십진수는 무작위로 분포된 것으로 보이지만 이 추측에 대한 증거는 아직 발견되지 않았습니다.

 

수천 년 동안 수학자들은 π의 값을 높은 정확도로 계산함으로써 π에 대한 이해를 넓히려는 시도를 해왔습니다. 이집트와 바빌로니아를 포함한 고대 문명은 실제 계산을 위해 상당히 정확한 π의 근사값을 필요로 했습니다. 기원전 250년경에 그리스 수학자 아르키메데스는 임의의 정확도로 π를 근사하는 알고리즘을 만들었습니다. 서기 5세기에 중국 수학자들은 π를 7자리로 근사하였고 인도 수학자들은 기하학 기술을 사용하여 5자리의 근사값을 구했습니다. 무한급수를 기반으로 하는 π에 대한 첫 번째 계산 공식은 천년 후에 발견되었습니다. 원의 둘레와 지름의 비율을 나타내기 위해 그리스 문자인 π의 최초의 사용은 1706년 웨일스의 수학자 William Jones가 사용한 것으로 알려져 있습니다.

 

미적분학의 발전은 모든 실용적인 계산에 충분한 π의 수백 자리의 계산으로 이어졌습니다. 그럼에도 불구하고, 20세기와 21세기에 수학자와 컴퓨터 과학자들은 증가하는 계산 능력과 결합하여 π의 십진법 표현을 수조 자릿수로 확장하는 새로운 접근 방식을 찾았습니다. 이러한 시도는 급수를 계산하기 위한 효율적인 알고리즘의 개발과 자리수 기록을 깨려는 인간의 탐구에 의해 동기가 부여되었습니다. 슈퍼컴퓨터를 테스트하는 데에도 사용되었습니다.

 

원주율의 정의는 원과 관련이 있기 때문에 π는 삼각법 및 기하학의 많은 공식, 특히 원, 타원 및 구와 관련된 공식에서 발견됩니다. 또한, 우주론, 프랙탈, 열역학, 역학, 전자기학과 같은 과학의 여러주제의 공식에서도 발견됩니다. 현대의 수학적 분석에서는 기하학에 대한 참조 없이 대신 정의되는 경우가 많습니다. 따라서 정수론이나 통계와 같이 기하학과 거의 관련이 없는 영역에서도 나타납니다. π의 넓은 효용성은 π를 과학 안팎에서 가장 널리 알려진 수학 상수 중 하나로 만듭니다. π에 관한 많은 책이 출판되었으며 최대기록의  π의 자릿수 계산은 종종 뉴스 헤드라인을 장식합니다.

 

Reference

Pi – Wikipedia


4.2. 참조


Reference

Pi – Wikipedia

기준과 단위 ?

1. 애니메이션

1.1. 3차원(공간) 단위


2. 설명

2.1. 기준(0)과 단위(1)


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 용어

4.1. 용어

1. 애니메이션



3차원 단위

2. 설명

2.1. 기준(0)과 단위(1)

0은 아무것도 없다는 관념적인 기준입니다. 현실에서도 아무것도 존재하지 않는 상태를 기준으로 사용하는 경우가 많이 있습니다. 0은 자신을 아무리 더해도 자신이 됩니다.

 

0과 대비되어 나온 1은  “있다”라는 의미입니다. 역시 관념적인 단위입니다. 1은 자신을 아무리 곱해도 자신이 되지만 더하면 더하는 횟수만큼 값이 늘어나게 됩니다. 그래서  “1”은 곱하기의 기준이 되고 더하기의 단위가 됩니다. 그리고  0과 1사이의 값과 1이상의 값의 경계인 1은 곱하기와 나누기의 경계가 됩니다.

한편, 0은 양수와 음수의 경계, 즉 더하기와 뺴기의 경계가 됩니다.

 

0과 1에 물리적인 단위가 붙으면 우리가 인지할 수 있는 단위가 됩니다.

길이 단위로는 meter, 질량단위로는 gram등이 있습니다. 이것은 합의하여 정한 것입니다. 단위가 있으면 기준이 있어야 하는데 이 또한  단위를 사용하는 주체의 합의가 있어야 합니다.

 

점(point)이 모여서 선(line)이 됩니다.

점(point)의 길이는 0입니다.

선은 단위(unit)가 있습니다.

선은 1차원(dimension)입니다.

선의 단위는 1 하나로 이루어 집니다.

 

선(line)이 모여서 면적(area)가 됩니다.

선(line)의 면적은 0입니다.

면적은 단위(unit)가 있습니다.

면적은 2차원(dimension)입니다.

면적의 단위는 1, 1 두개로 이루어 집니다.

 

면적(area)이 모여서 부피(volume)가 됩니다.

면적(area)의 부피는 0입니다.

부피는 단위(unit)가 있습니다.

부피는 3차원(dimension)입니다.

부피의 단위는 1, 1, 1 세개로 이루어 집니다.

 

 

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


차원단위 : 구글시트 실습

3.2. 함수

=TRANSPOSE(C3:C5) : 지정한 범위에 있는 데이터의 행과 열을 바뀜. C3와 C5에 있는 데이터는 열로 구성이 되는데, 이를 행으로 바꿈. 전치행렬을 만들 때 사용할 수 있음.

=MMULT(C3:C5,E3:G3) : 범위로 지정한 두 행렬의 곱. C3에서 C5에 있는 행렬과 E3에서 G3에 있는 행렬의 곱을 계산해서 구함.


3.3. 실습강의

– 데이터

– 당도의 제곱

– 당도 편차의 제곱

– 당도 편차와 과중 편차의 곱


4. 용어

3차원 좌표계 ?
3D coordinate system ?

1. 애니메이션

1.1. 3차원 직교좌표계


2. 설명

2.1. 3차원 직교좌표계

2.2. 원통좌표계

2.3. 복소 3차원 공간


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 용어

4.1. 용어

4.2. 참조

1. 애니메이션



3차원 직교좌표계

2. 설명

2.1 3차원 직교좌표계

세 변수를 가지는 요소(element, 객체, object)를 시각화 할 때, 3차원(공간)좌표계를 많이 사용합니다. 3차원(공간)좌표계에는 대표적으로 차원(three dimensions) 직교좌표계(Cartesian coordinate system)가 있습니다. 여기서 세 좌표축(axis)은 직각을 이루어서 서로 영향을 주지 않습니다.

예를 들어 위의 애니메이션에서 보는 바와 같이 딸기를 요소라 하면 딸기의 당도와 과중과 출하일은 변수가 됩니다. 이때 딸기를 점(point)로 생각한다면 당도와 과중과 출하일을 세 축으로 하는 3차원 직교좌표계를 사용하여 산점도를 그릴 수 있습니다.

다른 관점으로 공간에서의 한 점(point)을 표현하는 방법에는 대표적으로 직교좌표계(Cartesian coordinate system)가 있습니다. 세개의 선이 직각(perpendicular)으로 교차하는 좌표축(coordinate axis)을 가집니다.  공간의 한 점은 기준(Origin)에서의 거리를 좌표로 합니다. 그리고 그 거리는 같은 단위를 가집니다. 따라서 공간의 한 점은 세개의 좌표값으로 표현할 수 있습니다. 즉, 공간의 한점은 세개의 좌표의 변수값을 가집니다. 

공간좌표는 세개의 변수들의 관계를 나타내고 있기 때문에 3차원(three dimensions) 좌교계라고도 합니다. 한편, 평면좌표는 두개의 변수들의 관계를 나타내고 있기 때문에 2차원(two dimensions)좌표계라고 합니다.


2.2. 원통좌표계

한 개체에서의 속성으로 두 원인변수와 확률밀도, 세가지를 가질 때, 원통좌표계(cylindrical coordinate system)를 많이 사용합니다.


2.3. 복소3차원공간

복소3차원공간(complex 3D space)은 복소평면을 포함하는 3차원 좌표계입니다. 이 좌표계에서는 하나의 축이 실수부를, 다른 하나의 축이 허수부를 나타내며, 세 번째 축은 추가적인 차원(예를 들어, 물리적 공간의 한 차원 또는 다른 수학적 차원)을 나타내는 데 사용합니다.

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


3차원 직교좌표계 : 구글시트 실습

3.2. 함수

=ROWS(F2:F2) : 지정된 배열 또는 범위에 있는 행의 개수.


3.3. 실습강의

– 데이터

– 범위

– 산점도


4. 용어

4.1 용어


제목

내용.

Reference

Title – Wikipedia


4.2. 참조


Reference

Wikipedia