척도와 단위
Scale & unit

1. 애니메이션

1.1. 수체계


2. 설명

2.1. 물리에서 사용하는 척도와 단위

2.2. 경제에서 사용하는 척도와 단위


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 참조

4.1. 용어

4.2. 참고문헌

1. 애니메이션



수체계

2. 설명

2.1. 물리에서 사용하는 척도와 단위

물리적인 양을 측정할 때, 관측도구를 사용합니다. 관측도구에는 척도(scale)와 단위(unit)가 적용됩니다. 척도는 특정한 속성을 측정하기 위해 사용합니다. 척도에 따르는 단위는 측정의 기본적인 ‘양(quantity)’을 나타냅니다. 단위는 보통 국제적으로 표준화되어 있습니다. 예를 들어, 온도를 측정할 때 ‘도(°)’는 단위이며, 섭씨나 화씨는 이 온도를 표현하는 척도입니다.

기본 물리량의 척도와 단위

물리량

physical quantities

척도(단위)

scale(unit)

국제 단위계

SI 

척도유형

scale type

길이 미터(m), 센티미터(cm), 킬로미터(km), 마일(miles), 인치(inches) m 비율척도
질량 킬로그램(kg), 그램(g), 파운드(lbs), 온스(oz) kg 비율척도
시간 초(s), 분(min), 시(hour), 일(day), 년(year) s 비율척도
전류 볼트(V), 암페어(A), 와트(W), 옴(Ω) A 비율척도
온도 켈빈(K), 섭씨(°C), 화씨(°F) K 비율척도
물질의 양 몰(mol) mol 비율척도
광도

칸델라(cd)

cd 비율척도

주요 물리량의 보편적인 척도와 단위

물리량

physical quantities

척도(단위)

scale

척도유형

scale type

지진의 강도 리히터규모(단위없음) 순서척도
산성도 pH(단위없음) 로그척도(logarithm scale)
소리의 크기 데시벨(dB) 로그척도(logarithm scale)

2.2. 경제에서 사용하는 척도와 단위

경제에서 나타나는 개념을 양으로 표현할 때 그 양을 표현하기 위해 척도와 그에 따른 단위를 사용합니다.

경제에서의 주요 척도와 단위

경제량

economic quantities

척도(단위)

scale(unit)

척도유형

scale type

통화 한국 원(KRW), 미국 달러(USD), 유로(EUR), 일본 엔(JPY) 등 비율척도
성장률 경제 성장률(%), 인구 성장률(%) 비율척도
지수 주가지수(단위없음), 물가지수(단위없음) 간격척도

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.



3.2. 함수

=ROWS(F2:F2) : 지정된 배열 또는 범위에 있는 행의 개수.


3.3. 실습강의

– 실습강의 목차


4. 참조

4.1 용어


리커트 척도

리커트 척도는 그 발명자인 미국의 사회심리학자 Rensis Likert의 이름을 딴 심리측정 척도입니다. 이 척도는 연구 설문지에서 흔히 사용됩니다. 설문 연구에서 응답을 척도화하는 방식으로 가장 널리 사용되며, 때문에 ‘리커트 유형 척도(Likert-type scale)’라는 용어는 평가 척도(rating scale)와 종종 동의어로 사용되기도 하지만, 평가 척도에는 다른 유형들도 있습니다.

리커트는 척도 자체와 응답이 점수화되는 형식 사이를 구분하였습니다. 엄밀히 말하면, 리커트 척도는 전자만을 가리킵니다. 이 두 개념 사이의 차이는 리커트가 조사하려는 기본 현상과 그 현상을 나타내는 변동을 포착하는 방법 사이의 구분에서 나옵니다.

리커트 항목에 응답할 때, 응답자들은 일련의 진술에 대한 동의 또는 불일치의 수준을 대칭적인 동의-불일치 척도에서 지정합니다. 따라서, 척도는 주어진 항목에 대한 그들의 감정의 강도를 포착합니다.

척도는 개별 항목(질문) 세트에 대한 설문지 응답의 단순한 합계나 평균으로 생성될 수 있습니다. 이렇게 하면, 리커트 척도는 각 선택 사이의 거리가 동일하다고 가정합니다. 많은 연구자들은 높은 내적 일관성을 보이는 항목 세트를 사용하며, 동시에 연구 대상 전체 영역을 포착할 것이라고 가정합니다. 다른 연구자들은 “모든 항목이 서로의 복제본이라고 가정하거나 다시 말해 항목들이 병렬 도구로 간주된다”는 기준을 고수합니다. 반면, 현대의 시험 이론은 각 항목의 난이도를 항목 척도화에 포함시킬 정보로 간주합니다.

리커트 척도의 등간성에 대한 논의는 연구자들 사이에서 여전히 진행 중인 토론의 주제입니다. 일부 연구자들은 리커트 척도를 등간척도로 간주하여 적절한 통계 분석을 수행하며, 다른 연구자들은 그렇지 않다고 주장합니다.

특히 리커트 척도의 등간성을 수학적으로 증명한 구체적인 참고문헌을 제공하기는 어렵습니다. 이는 대부분의 연구가 통계적 또는 실증적인 근거를 기반으로 하는데, 수학적 증명 방식과는 다르기 때문입니다. 리커트 척도의 성질과 사용에 대한 더 깊은 연구나 이해를 원한다면, 측정 이론 (measurement theory) 또는 척도 이론 (scale theory) 관련 문헌을 참조하는 것이 좋습니다.

 

Reference

Likert scale – Wikipedia


척도와 단위의 기준
Standard of scale and unit

1. 애니메이션

1.1. 공간단위


2. 설명

2.1. 기준과 단위

2.2. 척도에서의 기준

2.3. 척도에서의 단위


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 참조

4.1. 용어

1. 애니메이션



공간단위

2. 설명

2.1. 기준과 단위

기준으로서 0

0은 “없음”을 나타냅니다. 0은 정수, 유리수, 실수, 복소수 등의 수체계에서 기준으로 사용됩니다. 어떤 수를 0으로 더하거나 빼도 그 수는 변하지 않습니다. 또한, 어떤 수를 0으로 곱하면 결과는 항상 0입니다. 분수에서 0은 분모가 될 수 없습니다. 즉, 0으로 나누는 것은 정의되지 않은 연산입니다. 0은 양수와 음수의 경계이며 더하기와 빼기의 항등원이 됩니다.

단위로서 1

1은 0과 대비되어 “있음”을 의미합니다. 1은 정수, 유리수, 실수 등의 수체계에서 단위로 사용됩니다. 어떤 수에 1을 곱하거나 나누어도 그 수는 변하지 않습니다. 그래서  “1”은 곱하기의 기준이 되고 더하기의 단위가 됩니다. 1은 진분수 (proper fraction; 분자가 분모보다 작은 분수로, 그 값이 1보다 작음)와 가분수(improper fraction; 분자가 분모보다 큰 분수로, 그 값이 1보다 큼)의 경계이며 1은 곱하기와 나누기의 항등원이 됩니다.

점(point)은 크기가 없는 개체(object)입니다. 점의 위치는 공간에서 점 자체입니다. 점(point)의 크기는 0입니다.

선(line)은 셀수 없는 많은 점이 모여서 됩니다. 공간에서 선의 위치는 두 점으로 결정됩니다. 선의 단위는 크기가 1인 선분(line segment)입니다.

면(plane)은 셀수 없는 많은 선(line)이 모여서 됩니다. 공간에서 면의 위치는 세 점으로 결정됩니다. 면의 단위는 크기가 1×1인 면적(area)입니다.

공간(space)은 셀수 없는 많은 면(plane)이 모여서 됩니다. 공간의 단위는 크기가 1×1×1인 부피(volume)입니다.

물리적 기준과 단위에 0과 1을 적용

0에 물리적인 기준이 붙으면 우리가 인지할 수 있는 기준이 됩니다. 예를 들어, 절대온도 0K에서는 분자의 운동이 없는 상태로 온도의 기준이 됩니다. 그리고 1에 물리적인 단위가 붙으면 우리가 인지할 수 있는 단위가 됩니다. 예를 들어, 길이의 단위로는 1m, 질량의 단위로는 1kg이 있습니다. 측정값(데이터)에 단위를 붙일 때는 ‘1’을 생략하고 기호만 측정값에 붙여 사용합니다.


2.2. 척도에서의 기준

비율척도에서의 기준 : 절대적인 기준으로서의 0과 비율의 기준인 1

비율척도에서의 0은 ‘완전한 부재’ 또는 ‘없음’을 의미합니다. 예를 들어, 무게나 길이에서 0은 실제로 아무것도 없음을 나타냅니다. 예를 들어, 절대적인 0은 온도에서의 절대영도(absolute zero)를 의미합니다. 이는 온도가 이론적으로 도달할 수 있는 최저점으로, 모든 분자 운동이 정지하는 지점입니다. 절대영도는 켈빈(K) 온도 척도에서 0K, 섭씨(C) 척도에서는 약 -273.15°C, 화씨(F) 척도에서는 약 -459.67°F에 해당합니다.

비율척도에서 비율의 기준은 양(quantity)으로 1을 사용합니다.

간격척도에서의 기준 : 상대적인 기준으로서의 0과 등간격의 기준인 1

상대적인 0은 간격척도에서 사용되는 0을 의미합니다. 이는 절대적인 ‘없음’을 나타내지 않고, 단지 특정한 기준점 또는 시작점을 나타냅니다. 예를 들어, 섭씨온도척도에서의 0도는 물이 얼기 시작하는 지점을 나타내지만, 이는 온도가 ‘없다’는 것을 의미하지 않습니다. 또 다른 예로는 년도에서의 기원이 있습니다. 기원은 기원전(BCE, before common era)과 기원후(CE, common era)를 나누는 서기 0년입니다. 따라서, 상대적인 0은 특정한 상황이나 상태의 정의라고 할 수 있으며, 절대적인 없음의 의미는 없습니다. 따라서 간격척도의 기준으로서의 0은 관측 대상이나 상황에 따라 다르게 설정될 수 있습니다.

간격척도에서 간격의 기준은 두 위치 사이의 거리로 1을 사용합니다. 따라서 간격척도는 등간격의 단위로 이루어집니다.

간격척도에서 기준 원점에서의 거리는 상대적인 방향을 가질 수 있습니다. 이 때 상대적인 방향은 양과 음의 기호로 구분하여 표현할 수 있습니다.

순서척도에서의 기준

순서척도에서 척도점들 중에서 한 척도점을 0으로 정하는 것은 척도점 사이에 간격을 주기 위한 과정이라고 볼 수 있습니다. 예를 들어 3개이상의 척도를 가지는 경우, 척도점을 “좋아한다”, “보통이다”, “싫어한다”로 하는 순서척도로 정한 경우, “보통이다”를 원점인 0으로 볼 수 있는가는 일반적으로 응답자마다 “보통이다”라는 느낌의 정의가 다를 것이라 추정할 수 있기 때문에 원점으로 보기가 어렵습니다. 또 다른 예를 들어 보면, 척도점을 “좋아한다”, “싫어한다”, “관심이 없다”로 하는 순서척도로 정한 경우, “관심이 없다”를 원점인 0으로 볼 수 있는가는 생각해 볼 수 있지만 문항과 검사환경에 많은 조건과 설명을 필요로 합니다.

명목척도에서의 기준

명목척도에서는 어떠한 기준도 없다고 할 수 있습니다. 하지만 명목(척도점)이 2개만 있는 경우, 하나를 기준으로 한다면 다른 하나가 값이 될 수 있습니다. 특히, 하나를 “없다”는 0으로 정하고 다른 하나를 “있다”는 1로 정할 수 있다면 “없다”를 기준으로 정하고 순서(order)와 간격(interval)과 양(quantity)을 모두 정할 수 있습니다.


2.3. 척도에서의 단위

간격척도에서의 단위

간격척도는 등간격으로 구성되며 그 등간격은 간격척도의 단위를 의미합니다. 간격척도는 두 관측대상의 위치간의 차이를 측정하는 데 사용되며, 차이는 단위의 배수로 표현되며 어느 위치를 기준으로 하는가에 따라 양과 음의 부호를 가지게 됩니다. 간격척도에서의 단위는 측정대상과 측정의 목적에 따라 결정됩니다. 예를 들어 온도를 관측하는 경우, 단위는 도(degree)로 같지만 섭씨, 화씨,  절대온도 3가지의 온도척도를 사용할 수 있습니다. 섭씨와 절대온도라는 온도척도에서 1°는 일정한 온도간격을 나타내며 단위입니다. 시간을 나타내는 척도는 초, 분, 시 등이 있으며 대응하는 단위는 s, min, hour입니다. 단위를 표기할 때 “1”은 생략합니다.

비율척도에서의 단위

비율척도(ratio scale)에서의 “단위”는 간격척도에서와 같이 측정값 간의 간격을 나타내지만 간격척도에는 없는 절대적인 0을 기준으로 합니다. 따라서 비율척도에서의 단위는 측정값 간의 차이뿐만아니라 비율의 의미도 가집니다. 비율척도에서의 단위는 측정대상과 측정의 목적에 따라 결정되며, 측정값 간의 일정한 간격과 비율을 표현하는 데 사용됩니다. 이러한 단위를 통해 측정대상 간의 차이와 비율을 정확하게 비교하고 해석할 수 있습니다. 예를 들면, 길이에서 1미터(m)는 특정시간동안 빛이 이동한 거리를 말합니다. 그리고 무게에서 1킬로그램(kg)은 물 1리터(liter)의 무게를 말합니다.

비례척도에서의 단위

비례척도(proportion scale)에서의 “단위”는 백분율(%, 퍼센트)를 많이 사용합니다. 0이상 1이하의 실수 ([0, 1])를 사용할 수도 있습니다. 비례척도는 주로 범주를 관측할 때 사용합니다. 이 경우 관측값은 이산형데이터(discret data)입니다.

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


차원단위 : 구글시트 실습

3.2. 함수

=TRANSPOSE(C3:C5) : 지정한 범위에 있는 데이터의 행과 열을 바뀜. C3와 C5에 있는 데이터는 열로 구성이 되는데, 이를 행으로 바꿈. 전치행렬을 만들 때 사용할 수 있음.

=MMULT(C3:C5,E3:G3) : 범위로 지정한 두 행렬의 곱. C3에서 C5에 있는 행렬과 E3에서 G3에 있는 행렬의 곱을 계산해서 구함.


3.3. 실습강의

– 데이터

– 당도의 제곱

– 당도 편차의 제곱

– 당도 편차와 과중 편차의 곱


4. 참조

문항반응 척도
Item response scale

1. 애니메이션

1.1. 문항속성(True, False)에 대한 반응(Positive & Negative)


2. 설명

2.1. 문항반응에서 사용하는 척도유형

2.2. 순서척도의 분류

2.3. 문항반응을 관측하는 척도의 종류

2.4. 척도평가

2.5. 척도개발


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 용어

4.1. 용어

1. 애니메이션



문항속성(True, False)에 대한 반응(Positive & Negative) 

2. 설명

2.1. 문항반응에서 사용하는 척도유형

문항반응에서는 응답자가 문항에 반응한 결과가 결과변수가 되는 경우와 응답자의 능력과 문항의 난이도가 반응하여 결과가 나오는 경우가 있습니다. 전자의 원인변수는 응답자의 속성이며 후자의 원인변수는 응답자의 능력과 문항의 난이도의 차이입니다. 이 때 응답자의 능력과 문항의 난이도는 같은 속성입니다. 원인변수가 되는 응답자의 속성과 응답자의 능력과 문항난이도는 명목척도를 순서척도, 간격척도, 비례척도로 변환할수록 더 많은 분석을 할 수 있습니다. 즉, 원인변수값을 질적데이터에서 양적데이터로 얻으려는 노력을 하게 됩니다.

명목척도

명목척도(nominal scale)는 불연속적인 개념이나 속성을 측정하기 위한 척도입니다. 이러한 척도에서는 각 명명된 항목이 서로 독립적이며, 순서나 계량적인 의미를 가지지 않습니다. 예를 들어 명목척도에는 성별, 종교, 국적 등이 있습니다. 예를 들어 명목척도인 성별에는 “남”과 “여”라는 두 범주(척도점)가 있습니다.

순서척도

순서척도(ordinal scale)는 명목척도와 다르게 범주(척도점)의 비교가 가능합니다. 비교를 통해 순서(순위)를 정할 수 있는 데 순서는 내림차순이거나 오름차순처럼 방향이 있습니다. 하지만 범주들 사이에는 순서만 있을 뿐 계량화된 간격이 없습니다. 예를 들어 등급, 선호도, 학점 등이 있습니다.

간격척도

간격척도(interval scale)는 순서척도의 범주의 최대값이 정의되는 척도입니다.  각 범주의 최대값 사이에는 간격이 있고 그 간격은 계량할 수 있음을 의미합니다. 따라서 간격척도는 범주의 상대 위치를 나타냅니다. 예를 들어 섭씨온도, 지능지수, 연도 등이 있습니다.

비례척도

비례척도(ratio scale)는 간격척도에 존재의 없음을 의미하는 0이 부가되어 위치의 기준으로 사용됩니다. 0으로부터의 거리는 양이며 간격척도가 음수와 양수로 순서가 표현되는 것에 비해 비례척도에서는 양이 없음(존재하지 않음)을 의미하는 0이 있습니다. 양의 기준인 1로 관측대상의 양(quantity)을 표현합니다. 관측대상의 양이 0과 1사이에 있을 때 기준인1을 나눔으로 표현합니다. 그리고 기준보다 큰 경우에는 기준의 배수와 0과 1사이의 값의 합으로 표현합니다. 비례척도는 양의 기준인 1에 비례하는 값을 척도로 가진다고 할 수 있습니다. 비례척도는 양(quantity)을 나타내므로 양의 실수(positive real number)의 수체계로 나타냅니다. 예를 들어, 절대온도, 나이, 몸무게, 소득 등이 있습니다.


2.2. 순서척도의 분류

5점척도와 7점척도

순서정보가 있는 명목(이름)으로 표현하는 척도점의 수를 많게 하면 척도가 응답자들을 판별할 수 있는 능력은 커지지만, 응답자는 응답이 어려워지는 단점이 있습니다. 척도점의 수를 작게 하면 척도점간의 상관은 작아지는 장점이 있습니다. 척도점의 수가 소수(prime number)인 5점척도와 7점척도가 주로 사용됩니다.

짝수점척도와 홀수점척도

짝수점척도는 척도점의 수가 짝수인 척도로 중간점이 없으며 대칭을 만들기가 어렵습니다. 홀수점척도는 중간점이 있어서 대칭이지만 응답자의 응답이 심리적인 이유로 중간점으로 쏠릴 가능성이 높습니다. 일반적으로 짝수점척도보다 홀수점척도가 더 많이 쓰입니다.

균형척도와 불균형척도 

균형척도는 긍정적 의미를 갖는 척도점의 수와 부정적 의미의 척도점의 수가 같은 척도입니다. 응답자가 편견이 없을 때 유용합니다. 불균형척도는 응답자가 편견이 있어 응답이 중간점을 기준으로 어느 한쪽으로 치우칠 경우, 편견을 보정해 주기 위하여 사용합니다.

단일항목척도와 다항목척도

단일항목척도는 한 항목(item)으로 구성되어 있습니다. 다항목척도는 한 질문과 다수의 항목으로 구성되어 있습니다. 

단일항목척도의 예

질문(question) : A음식점의 맛은 ?

항목(item) : 좋다.

선택지(option) : 동의한다. – 동의하지 않는다.

단일항목척도의 예

항목(item) : A음식점의 맛은 좋다

선택지(option) : 동의한다. – 동의하지 않는다.

다항목척도의 예

질문(question) : 생일축하연 장소로 A음식점은 ?

항목(item) 1 : 음식이 맛있다.

선택지(option) : 매우 그렇다. – 그렇다. – 보통이다. – 그렇지 않다. – 매우 그렇지 않다.

항목(item) 2 : 경제적이다.

선택지(option) : 매우 그렇지 않다. – 그렇지 않다. – 보통이다. – 그렇다. – 매우 그렇다.

항목(item) 3 : 교통이 좋다.

선택지(option) : 매우 그렇지 않다. – 그렇지 않다. – 보통이다. – 그렇다. – 매우 그렇다.

다항목척도에서의 단방향척도와 혼합형척도

다항목척도에서 항목의 긍정과 부정의 방향이 일치하면 단방향척도이고 혼재되어있으면 혼합형 척도입니다. 

척도점의 강도표현

척도점이 “좋다”, “나쁘다”, “보통이다”인 경우 강도표현은 매우, 약간 등등이 있을 수 있습니다. 이 때 강도는 중간점을 기준으로 양쪽으로 대칭적으로 부여하는 것이 좋으나 척도점의 표현이 길어져서 정확하고 효율적인 실험을 어렵게 합니다. 부가되는 의미가 강할수록 응답자는 극단 값을 피하기 위해 가운데로 몰리는 경향이 있습니다.


2.3. 문항반응을 관측하는 척도의 종류

질문(question)과 항목(item)을 합해서 문항(question & item)이라고 합니다. 선택지는 문항에 대한 응답의 범주를 반응의 정도에 따라 순서대로 나열한 것입니다. 그리고 문항반응은 선택지에서 문항에 대한 응답 범주를 선택하는 것을 의미합니다. 따라서 문항과 선택지를 합한 것을 순서척도라고 할 수 있습니다. 

리커트척도 (Likert scale)

어떤 항목(진술)에 대해 응답자가 동의하거나 동의하지 않는 정도를 표시하도록 하는 척도입니다. 척도점은 응답을 나타내는 범주인 응답범주의 이름입니다. 따라서 척도점의 수는 응답범주의 수와 같습니다. 순서척도를 간격척도로 바꾸면 순서척도의 척도점은 범주의 최대값을 의미하며 양적데이터입니다. 정리하면 리커트척도를 순서척도에서 간격척도화 했을 때, 간격척도의 구간은 순서척도에서의 척도점의 최대값으로 구분됩니다. 

 

리커드척도 예

질문 : A서비스센터 직원들의 업무태도는 ?

항목 : A서비스센터 직원들은 친절하다.

척도점 : 전혀 동의하지 않는다.   $\cdots$   전적으로 동의한다.

의미차별화척도 (semantic differential scale)

서로 반대되는 의미의 말을 양쪽 끝의 척도점(응답범주)에 표현한 척도입니다. 예를 들면 불공정과 공정, 불친절과 친절, 비상식과 상식 등이 있습니다.

의미차별화척도 예

질문 : A서비스센터 직원들은 ?

척도점 : 불친절하다.   $\cdots$   친절하다.

등급척도 (rating scale)

등급을 척도점(응답범주)으로 가지는 척도로써 “중요성 등급척도”, “평가 등급척도”, “Stapel 등급척도” , “서열 등급척도”, “비교 등급척도” 등 여러가지 방식이 있습니다.

Stapel 등급척도 예

질문 : A서비스센터 직원들은 ?

척도점 : -3   -2  -1  친절하다   +1  +2   +3


2.4. 척도평가

관측값모델

관측값은 다음과 같이 모델링됩니다.

$$X_O=X_T + X_S + X_R$$

여기서,  $X_O$는 관측값(measured value or observed value)

$X_T$는 실제값(true value)

$X_S$는 체계적 오류(systematic error)이며 척도의 오류

$X_R$은 비체계적 오류(nonsystematic error or random error)이며 관측자와 관환경에 따른 오류

타당성

척도의 타당성(validity)은 측정하고자 하는 대상인 개체의 속성이나 구성개념 등을 척도가 실제로 측정하는 정도입니다. 예를 들어, 지능을 측정하는 척도가 실제로 지능의 다양한 측면을 적절하게 나타낸다면, 그 척도는 그 지능에 대해 높은 타당성을 가진다고 할 수 있습니다. 척도의 타당성이 높을수록 체계적 오류가 작아집니다.

정확성

척도의 정확성(accuracy)은 측정값이 실제 값에 얼마나 가까운지를 나타냅니다. 예를 들어, 체온계가 실제 체온을 정확하게 측정한다면, 그 체온계는 높은 정확성을 가진다고 할 수 있습니다.

정밀성

척도의 정밀성(precision)은 측정값들의 차이를 얼마나 작은 값까지 나타낼 수 있는지의 정도입니다. 예를 들어, 관측값은 비체계적 오류(무작위 오류)의 영향을 받는 데 척도의 정밀도가 높으면 더 작은 비체계적 오류도 알 수 있게 됩니다.

신뢰성

척도의 신뢰성(reliability)은 한 대상을 반복 측정했을 때 동일한 결과를 얻는 정도를 말합니다. 비체계적 오류는 관측하는 사람이나 상황으로부터 발생하는 오류입니다. 비체계적 오류가 작을수록 그 척도의 신뢰성은 높습니다. 척도의 신뢰성에는 다음과 같은 것들이 있습니다.

–  반복측정 신뢰성(test-retest reliability)

반복측정 신뢰성은 같은 척도로 관측을 2회 실시하여 2회의 관측값들을 구하고 관측값들 간의 상관관계로 구한 척도의 신뢰성입니다. 상관계수가 크면 척도의 반복측정 신뢰성이 높다고 할 수 있습니다.

–  대안항목 신뢰성(alternative-form reliability)

한 척도로 측정하여 측정값들을 구하고 유사하지만 대안이 될수 있는 항목을 가진 척도로 다시 측정하여 관측값들 구합니다. 두 관측값집합의 상관계수로 척도의 대안항목 신뢰성을 평가합니다. 반복측정 신뢰성은 주시험효과가 작용할 수 있습니다. 주시험효과를 방지하기 위하여 두 번째 측정할 때 첫 번째 사용한 척도와 유사하지만 다른 척도를 사용합니다.

다항목척도의 내적 일관성

지능, 동기부여, 학습 태도 등을 구성개념(construct)라고 하는 데 심리학이나 교육학에서 관측하고자 하는 이론적인 개념입니다. 여기서, 한 구성개념을 측정하는 다항목척도는 항목들이 일관성을 가져야 합니다. 이 일관성을 “다항목척도의 내적 일관성(internal consistency)”이라고 합니다.

크론바흐계수 $\alpha$ (Cronbach’s coefficient $\alpha$)”는 다항목척도의 내적 일관성”을 표현하는 방법 중에서 가장 널리 쓰이는 방법입니다. 크론바흐계수는 다음식으로 구합니다.

$$\alpha=\dfrac{k}{(k-1)} \left(  1-\dfrac{\sum_\limits {i=1}^{k}\sigma_i^2}{\sigma_T^2}\right)$$

여기서,  $k$는 항목 수

$\sigma_i^2$은 $i$번째 항목의 분산

$\sigma_T^2$은 전체 항목의 분산

다르게 표현하면

$$\alpha=\dfrac{k \bar r}{1+{\bar r}(k-1)}$$

여기서,  $\bar r$은 항목간 상관계수의 평균

크론바흐계수 $\alpha$는 0 에서 1 사이의 값을 가지며, 높을수록 바람직합니다. 흔히 0.8에서 0.9 이상이면 만족할 수 있고 0.6에서 0.7이면 수용할 수 있습니다. $\alpha$계수가 매우 작으면 그 데이터는 내적 일관성을 결여한 것으로, 본 분석에서 사용할 수 없습니다. $\alpha$계수의 크기를 저해하는 항목들을 제거함으로써 계수값을 크게 할 수 있습니다. 

항목의 수와 $\alpha$계수의 크기는 양의 상관입니다. 척도점의 수와 $\alpha$계수의 크기도 양의 상관입니다. 그러나 표본의 크기와 $\alpha$계수의 크기는 음의 상관입니다. 


2.5. 척도개발

1) 개념정의 및 목표설정

척도를 개발하기 전에 먼저 관측하고자 하는 개념을 정의하고, 척도개발의 목표를 설정합니다. 이를 위해 선행연구조사와 인터뷰 등을 수행합니다.

2) 관측대상 분석

정의한 개념을 가진 관측대상을 분석합니다. 

관측대상인 개체의 속성(특징, 특성)이나 범주의 속성(특징, 특성) 등을 분석하여 항목을 생성합니다.

3) 척도유형 결정

척도유형에 따라 개발 방법이 다르므로, 척도유형을 먼저 결정합니다.

4) 문항 생성

여러 개의 항목을 생성합니다.

항목생성 시 관측대상인 개체나 범주의 속성(특성)이나 관측목적, 관측방식 등을 고려해야 합니다.

도메인 내의 구성요소나 구성요소와 연결된 특성을 고려하고, 데이터수집을 위한 관측도구의 목적과 측정방식 등을 고려합니다.

5) 문항 검토 및 문항 수정

생성된 문항들에 대해 검토를 수행합니다. 이 과정에서 문항들의 유형, 내용, 언어 등을 확인하고, 중복된 문항, 혼란스러운 문항, 문맥에 부적합한 문항 등을 제거하거나 수정합니다.

6) 척도개발 및 척도검증

선정된 문항들을 기반으로 척도를 개발합니다. 척도 유형에 따라 척도 개발 방법이 다르며, 각 문항들의 가중치, 점수 범위, 객관적 테스트 등을 고려합니다. 이후, 개발된 척도를 검증하기 위해 신뢰성, 타당성, 일관성 등에 대한 검증을 수행합니다. 이를 위해 적절한 통계분석 방법을 사용합니다.

7) 보고서 작성

마지막으로, 개발된 척도와 검증결과에 대한 보고서를 작성합니다. 보고서는 척도의 개념, 목표, 유형, 개발과정 및 검증과정, 검증결과 등을 설명하며, 척도의 사용자들이 척도를 올바르게 사용할 수 있도록 지침서 등을 포함하여 작성합니다.

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.



3.2. 함수

=ROWS(F2:F2) : 지정된 배열 또는 범위에 있는 행의 개수.


3.3. 실습강의

– 실습강의 목차


4. 참조

4.1 용어


데이터

데이터는 질적 또는 양적 변수값의 집합입니다. 데이터와 정보 또는 지식은 종종 같은 의미로 사용하지만 데이터를 분석하면 정보가 된다고 볼 수 있습니다. 데이터는 일반적으로 연구의 결과물로 얻어집니다. 한편, 데이터는 경제(매출, 수익, 주가 등), 정부(예 : 범죄율, 실업률, 문맹율)와  비정부기구(예 : 노숙자 인구 조사)등 다양한 분야에서도 나타납니다. 그리고 데이터를 수집 및 분석하고 시각화할 수 있습니다.

 

일반적인 개념의 데이터는 응용이나 처리에 적합한 형태로 표현되거나 코딩됩니다. 원시 데이터 (“정리되지 않은 데이터”)는  “정리”되기 전의 숫자 또는 문자의 모음입니다. 따라서 데이터의 오류를 제거하려면 원시 데이터에서 데이터를 수정해야 합니다. 데이터 정리는 일반적으로 단계별로 이루어지며 한 단계의 “정리 된 데이터”는 다음 단계의 “원시 데이터”가 됩니다. 현장 데이터는 자연적인  “현장”에서 수집되는 원시 데이터입니다. 실험 데이터는 관찰 및 기록을 통한 과학적 조사에서 생성되는 데이터입니다. 데이터는 디지털 경제의 새로운 자원입니다.

 

Reference

Data – Wikipedia


척도와 수체계
scale & number system

1. 애니메이션

1.1. 수체계


2. 설명

2.1. 수체계

2.2. 척도에 따른 수체계

2.3. 유한수체

2.4. 척도에 유한수체를 적용

2.5. 리커트척도


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 참조

4.1. 용어

4.2. 참고문헌

1. 애니메이션



수체계

2. 설명

2.1. 수체계

수체계(system of numbers)란 수학에서 사용되는 숫자들의 집합과 그들 간의 연산들의 규칙이 결정되어 있는 체계를 말합니다. 대표적으로 자연수, 정수, 유리수, 실수, 복소수 등이 있습니다. 여기서, 복소수는 실수를 실수는 유리수를 유리수는 정수를 정수는 자연수를 포함합니다. 다르게 말하면, 자연수는 정수의 부분집합이고 정수는 유리수의 부분집합이고 유리수는 실수의 부분집합이고 실수는 복소수의 부분집합입니다. 수체계는 속성을 표현하는 변수를 모델링하기 때문에 속성이 반응하여 현상을 분석하여 문제를 해결하는 방법의 기반을 제공합니다. 

자연수

자연수(自然數, natural numbers)는 1, 2, 3, 4, 5, … 와 같이 기준의 양인 1과 그 기준의 합의 양으로 이루어진 집합입니다. 자연수 체계에서는 덧셈과 곱셈이 정의되어 있습니다. 즉, 두 자연수를 더하거나 곱할 때에는 반드시 자연수가 나옵니다. 하지만 자연수에서 자연수를 빼는 뺄샘과 자연수를 자연수로 나누는 나눗셈의 결과는 자연수가 아닐 수도 있습니다.

정수

정수(正數, integers)는 자연수에 0과 음의 자연수를 추가한 것입니다. 어떤 자연수의 음의 자연수는 그 자연수에 더하면 덧셈의 항등원인 0이 되는 수입니다.  이러한 정수에서는 덧셈과 곱셈 외에 뺄셈도 정의되어 있습니다. 즉, 두 정수를 더하거나 빼거나 곱하면 반드시 정수가 나옵니다. 단, 정수를 정수로 나누는 나눗셈의 결과는 정수가 아닐 수도 있습니다.

유리수

유리수(有理數, rational numbers)는 정수에 분수의 형태로 나타낼 수 있는 수를 추가한 것입니다. 분수는 정수를 0을 제외한 정수로 나눈 것입니다. 유리수에서는 덧셈, 뺄셈, 곱셈, 나눗셈이 모두 정의되어 있습니다. 즉, 두 유리수를 더하거나 빼거나 곱하거나 나눈 결과도 모두 유리수가 됩니다. 유리수는 정수와 소수(小數, decimal)의 합으로 표현합니다. 여기서 소수(小數)는 0과 1사이의 값을 의미하며 십진법으로 표현합니다. 그리고 소수점(小數點, decimal point)은 십진법에서 정수(正數)와 소수(小數)를 구분하는 점입니다. 따라서 유리수를 십진법으로 표현하면 정수(正數)와 소수(小數)의 합이라고 할 수 있습니다. 유리수는 소수점이하 자리수가 유한한 유한소수(有限小數, finite decimal)와 무한한 무한소수(無限小數, infinite decimal, infinite series)로 표현할 수 있습니다. 한편, 제곱해서 2가 되는 수(2의 제곱근)와 원의 반지름과 면적의 비율을 나타내는 수(원주율)는 분수의 형태로 표현할 수 없는 데 이를 무리수(無理數, irrational numbers)라고 합니다.

실수

실수는 유리수에 무리수를 추가한 것입니다. 실수는 무한소수나 극한값을 이용하여 나타낼 수 있으며, 실수에서는 덧셈과 곱셈, 나눗셈, 제곱근, 거듭제곱근 등이 정의되어 있습니다.

복소수

복소수는 실수에 허수를 추가한 것입니다. 허수는 제곱하면 음수가 되는 수입니다. 허수의 양의 기준은 i로 표현합니다. 복소수는 실수와 허수를 더한 형태로  a와 b가 실수일 때, a+bi와 같은 형태로 나타냅니다. 복소수에서는 사칙연산이 정의되어 있습니다. 실수는 시각적으로 직선상의 점으로 표현할 수 있지만 복소수는 2차원 평면인 복소평면에서 원점을 시작으로 하는 벡터로 표현합니다.


2.2. 척도에 따른 수체계

비례척도에 따른 데이터의 수체계

척도에 따라 데이터(관측값)의 수체계가 결정됩니다. 비례척도가 적용된 관측도구로 구한 관측값(데이터는) 0과 양의 실수입니다. 실수를 정의역으로하는 정규분포와 같은 확률변수의 분포모델을 사용하여 범주간의 속성을 비교분석하거나 표본으로 모집단을 추론하거나 생성될 표본을 예측할 수 있습니다. 간격척도로 구한 데이터의 기준을 관측대상의 속성이 없어지는 절대영점으로 0으로 하고 기준으로부터의 간격척도의 각 간격의 값을 알면 실수에서 정립된 통계모델을 사용할 수 있습니다. 정리하면 명목척도로 관측된 데이터에 순서를 부여하고 간격을 부여하고 데이터가 표현하는 속성이 없어지는 0점을 찾으면 실수체계에서 정립된 통계모델을 사용하여 데이터분석을 수행할 수 있습니다. 반대로 비례척도와 간격척도를 인간과 친화적인 명목척도, 순서척도로 변화하기도 합니다.

통계적 분석을 위해서 명목척도와 순서척도를 간격척도나 비례척도로 변환

개체의 속성에 대한 분석을 하기 위해서는 우선 속성을 나타내는 변수를 관측하여야 합니다. 변수를 관측함에 있어 비례척도를 적용할 수 있도록 변수를 정의하는 것이 매우 중요합니다. 그 이유는 개체의 속성을 나타내는 변수가 확률변수이면 통계적인 분석을 시도할 수 있기 때문입니다. 그리고 대다수를 차지하는 속성인 정규분포를 분석하기 위해서는 평균과 분산이 필요합니다. 정규분포를 가지는 개체의 속성은 매개변수인 평균과 분산으로 표현됩니다. 여기서, 평균과 분산은 비례척도로 얻은 데이터로부터 추정할 수 있다는 점에서 비례척도의 효용성이 크다고 할 수 있습니다. 비례척도로 구한 데이터로는 높은 수준의 통계적 분석을 행 할 수 있습니다. 또한 시공간에서 모델링한 범주의 확률적 속성을 통한 예측을 행할 수도 있습니다. 한편, 간격척도를 비례척도화하는 방법의 예로는 다음 두 과정이 있습니다. 첫번째로 간격척도의 간격을 등간격으로 하고 등간격과 비례척도의 1과의 관계를 수식으로 표현합니다. 두번째로 간격척도의 위치의 원점과 비례척도의 0의 위치와의 관계를 수식으로 표현합니다. 분포의 위치를 표현하는 측도는 평균이 있고 분포의 크기를 표현하는 측도는 분산이 있습니다. 따라서 평균과 분산을 모두 구하기 위한 데이터(관측값)를 얻기 위해서는 비례척도를 가진 관측도구(측정도구)가 필요합니다.


2.3. 유한수체

유한수체(유한체, finite field, Galois field)는 원소의 개수가 유한한 체(field)를 말합니다. 유한수체의 특징은 그 크기가 항상 소수의 거듭제곱 형태로 나타납니다.

$$p^n$$

여기서, $p$는 소수(prime number)

$n$은 자연수

유한수의 체(field)는 덧셈, 뺄셈, 곱셈, 나눗셈(0으로 나누는 것 제외)에 대해 닫혀 있는 대수적 구조를 의미하며, 이러한 연산에 대해 다음과 같은 공리를 만족합니다.

닫힘: 체의 모든 원소에 대해 덧셈과 곱셈 연산을 수행해도 결과는 항상 체 내의 원소입니다.

결합 법칙: 덧셈과 곱셈 모두에 대해 결합 법칙이 성립합니다.

가환 법칙: 덧셈과 곱셈 모두에 대해 가환 법칙이 성립합니다.

항등원의 존재: 덧셈에 대한 항등원(0)과 곱셈에 대한 항등원(1)이 존재합니다.

역원의 존재: 체의 모든 원소, a에 대해 덧셈 역원(-a)과 곱셈 역원(1/a, a ≠ 0)이 존재합니다.

분배 법칙: 곱셈과 덧셈에 대해 분배 법칙을 만족합니다.

 

유한수체의 예

유한수체의 간단한 예는 2진수와 5진수가 있습니다. 7진수가 있습니다. 모두 크기가 소수(素數)입니다. 2진수는 0과 1의 두 개의 수의 집합입니다. 2진수는 이분척도(binomial scale)인 “있음과 없음” 또는 “성공과 실패” 라는 개념으로 바꿀 수 있습니다. 5진수는 등간격인 숫자로 이루어진 {0,1,2,3,4}이고 집합의 크기인 5는 소수(素數)입니다. 10진수는 0, 1, 2, 3, 4, 5, 6, 7, 8, 9라는 10개의 숫자기호로 나타냅니다. 10진수의 개수는 10으로 소수(素數)가 아닙니다. 


2.4. 척도에 유한수체를 적용

척도가 유한수체를 나타내면 관측결과를 수치화하여 산술연산하더라도 서로 다른 정도를 나타냄을 보장합니다. 그리고 범주의 속성을 결정하는 척도의 각 항목은 명시적으로 구분할 수 있어야 합니다. 즉, 범주형 속성의 값은 서로 이질적이고 상호 배타적이어야 합니다.

명목척도에 유한수체를 적용

유한수체를 명목척도에 적용하기 위해 명목척도의 명목의 수를 소수(素數)로 합니다. 그리고 개체의 범주형 속성에 명목과 순서를 부여하여 각 범주를 순서대로 나열합니다. 순서대로 나열된 범주 사이에 수치를 가지는 간격을 부여하여 질적데이터를 양적데이터로 모델링합니다. 간격이 부여된 범주형 데이터는 데이터를 분석하여 위치를 나타내는 속성을 분석할 수 있습니다. 여기서 범주의 개수가 소수이면 범주의 위치 속성을 연속으로 모델링할 수 있습니다. 또한,  범주의 속성이 무(無)가 되는 0을 모델링하여 절대기준으로하고  양의 크기의 기준인 1과 그 단위를 모델링하면 범주의 명목을 범주형 확률변수에서 연속형 확률변수로 변환할 수 있습니다. 즉, 범주의 위치의 속성과 범주내의 개체의 퍼짐의 속성을 동시에 분석할 수 있습니다. 연속형 확률분포를 가지는 통계모델의 확률분포 모수(parameter)를 구하면 궁극적으로 개체의 속성을 생성하는 확률모델을 추정할 수 있습니다.  


2.5. 리커트척도

5점척도, 7점척도

 리커트척도(Likert scale)의 첫 단계를 속성이 존재하지 않는 상태로 하고 마지막 단계를 속성이 모두 있는 상태로 하는 순서척도(ordinal scale)입니다. 각 단계의 개수를 5단계, 7단계인 소수로 하고 각 단계에 간격을 부여하여 간격척도로 변환합니다. 리커트척도의 예를 보면,  “매우 그렇다”, “다소 그렇다”, “보통이다”, “다소 그렇지 않다”, “매우 그렇지 않다”와 같이 5단계를 텍스트로 표현합니다.  텍스트로 표현된 단계를 각각 0, 1, 2, 3, 4와 같은 5진수로 하여 리커트척도를 유한수체로 만듭니다. 이 리커트척도로 구한 데이터(관측값)를 연산한 결과는 유한수체의 공리를 만족합니다.

리커트척도를 적용한 관측도구

척도는 관측대상을 관측하는 관측도구에 적용됩니다. 그리고 척도는 관측대상인 개체의 속성을 표현합니다. 척도는 명목척도, 순서척도, 간격척도, 비례척도로 분류할 수 있습니다. 일반적인 리커트척도는 순서척도입니다. 관측도구는 적절한 척도를 포함하고 있어야 하고 정확하고 효율적이어야 합니다. 리커트척도가 적용된 관측도구는 범주형 속성을 가지는 개체의 속성의 범주와 그 범주의 순서를 관측합니다. 순서척도인 리커트척도에 간격을 부여하여 간격척도로 변환할 수 있습니다. 더 나아가 속성을 양(quantity, 量)으로 모델링하고 양의 기준(“0” 과 “1”)을 정의하여 리커트척도를 비례척도로 변환할 수 있습니다. 사회과학에서 리커트척도를 가지는 대표적인 관측도구는 설문이 있습니다.  

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.



3.2. 함수

=ROWS(F2:F2) : 지정된 배열 또는 범위에 있는 행의 개수.


3.3. 실습강의

– 실습강의 목차


4. 참조

4.1 용어


리커트 척도

리커트 척도는 그 발명자인 미국의 사회심리학자 Rensis Likert의 이름을 딴 심리측정 척도입니다. 이 척도는 연구 설문지에서 흔히 사용됩니다. 설문 연구에서 응답을 척도화하는 방식으로 가장 널리 사용되며, 때문에 ‘리커트 유형 척도(Likert-type scale)’라는 용어는 평가 척도(rating scale)와 종종 동의어로 사용되기도 하지만, 평가 척도에는 다른 유형들도 있습니다.

리커트는 척도 자체와 응답이 점수화되는 형식 사이를 구분하였습니다. 엄밀히 말하면, 리커트 척도는 전자만을 가리킵니다. 이 두 개념 사이의 차이는 리커트가 조사하려는 기본 현상과 그 현상을 나타내는 변동을 포착하는 방법 사이의 구분에서 나옵니다.

리커트 항목에 응답할 때, 응답자들은 일련의 진술에 대한 동의 또는 불일치의 수준을 대칭적인 동의-불일치 척도에서 지정합니다. 따라서, 척도는 주어진 항목에 대한 그들의 감정의 강도를 포착합니다.

척도는 개별 항목(질문) 세트에 대한 설문지 응답의 단순한 합계나 평균으로 생성될 수 있습니다. 이렇게 하면, 리커트 척도는 각 선택 사이의 거리가 동일하다고 가정합니다. 많은 연구자들은 높은 내적 일관성을 보이는 항목 세트를 사용하며, 동시에 연구 대상 전체 영역을 포착할 것이라고 가정합니다. 다른 연구자들은 “모든 항목이 서로의 복제본이라고 가정하거나 다시 말해 항목들이 병렬 도구로 간주된다”는 기준을 고수합니다. 반면, 현대의 시험 이론은 각 항목의 난이도를 항목 척도화에 포함시킬 정보로 간주합니다.

리커트 척도의 등간성에 대한 논의는 연구자들 사이에서 여전히 진행 중인 토론의 주제입니다. 일부 연구자들은 리커트 척도를 등간척도로 간주하여 적절한 통계 분석을 수행하며, 다른 연구자들은 그렇지 않다고 주장합니다.

특히 리커트 척도의 등간성을 수학적으로 증명한 구체적인 참고문헌을 제공하기는 어렵습니다. 이는 대부분의 연구가 통계적 또는 실증적인 근거를 기반으로 하는데, 수학적 증명 방식과는 다르기 때문입니다. 리커트 척도의 성질과 사용에 대한 더 깊은 연구나 이해를 원한다면, 측정 이론 (measurement theory) 또는 척도 이론 (scale theory) 관련 문헌을 참조하는 것이 좋습니다.

 

Reference

Likert scale – Wikipedia


척도와 측도
scale & measure

1. 애니메이션

1.1. 순서척도와 간격척도

1.2. 분위수와 간격척도

1.3. 비율척도


2. 설명

2.1. “0”의 의미

2.2. “1”의 의미

2.3. 척도

2.4. 측도

2.5. 측도로서의 확률


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 참조

4.1. 용어

4.2. 참고문헌

1. 애니메이션



순서척도와 간격척도




분위수와 간격척도




비율척도

2. 설명

2.1. “0”의 의미

척도의 의미를 이해하는데 있어, 척도에서 사용한 “0”에 대한 이해가 선행되어야 합니다.

실체의 부재

실체를 정의하고, 그 실체가 없음을 나타낼 때, 0을 사용합니다. 예를 들어, 사과가 0개 있다는 의미는 사과가 무엇인지 정의하고, 그 정의에 맞는 사과가 없음을 의미합니다.

균형의 의미

양의 값과 음의 값, 혹은 양의 크기와 음의 크기가 있을 때, “0”은 그 양쪽의 값, 크기가 같아서 균형이 이룸을 의미합니다. 예를 들어, 이익이 0이라고 한다면, 손실과 이익이 없거나, 손실과 이익의 크기가 같아서 균형을 이룸을 의미합니다.

기준의 의미

시간의 시작 시점은 정의를 내리기 어렵기 때문에 양을 측정하기도 어렵게 됩니다. 그래서, 특정 시점을 기준으로 둘 수 있습니다.  엑셀, 구글시트와 같은 스프레드시트에서는 1899년 12월 30일 오전 12시를 기준으로 하는데, 이를 숫자로 변환하면 “0”입니다. 1를 더하면, 1899년 12월 31일 오전 12시가 되고, 0.1를 더하면, 1899년 12월 30일 오전 2시 24분이 됩니다.

자리 표시자

“0”은 숫자 체계에서 자리 표시자로 사용되기도 합니다. 10진법에서 100이라는 숫자는 10의 2승이 1개, 10의 1승이 0개, 10의 0승이 0개라는 의미인데, 100에서 1은 백의 자리 수이고, 두번째 0은 십의 자리 수, 세번째 0은 일의 자리 수입니다.

덧셈의 항등원

덧셈의 항등원으로서의 0는 어떤 수와 0을 더해도 그 수가 변하지 않는 수입니다. 예를 들어, 5 + 0 = 5, 10 + 0 = 10, -2 + 0 = -2와 같은 식으로 0은 어떤 수를 더해도 그 수에 영향을 미치지 않습니다.


2.2. “1”의 의미

척도의 의미를 이해하는 데 있어서 ‘0″과 마찬가지로 “1”에 대한 이해가 우선되어야 합니다.

실체의 존재와 양을 측정

실체를 정의하고, 그 실체가 있음의 완전함을 표현할 때, 1을 사용합니다. 예를 들어, 사과가 1개 있다는 의미는 사과가 무엇인지 정의하고, 그 정의에 맞는 사과가 있음을 의미합니다.

곱셈의 항등원

숫자 1은 소수도 합성수도 아닌 유일한 수입니다. 어떤 수든 1을 곱하면 원래의 수가 되며, 1은 곱셈의 항등원입니다.

확률에서 1

확률에서 1은 “확실이 출현할 사건이나 합사건”을 표현합니다. 사건의 확률은 일반적으로 0부터 1 사이의 값을 가지며, 0은 “불가능한 사건”을, 1은 “확실한 사건”을 나타냅니다.

예를 들어, 동전 던지기에서 앞면과 뒷면이 완벽히 같은 동전이라면 앞면이 나올 사건의 확률은 0.5로, 앞면이 나오지 않을 사건의 확률은 0.5으로 표현합니다. 이 경우, 앞면과 뒷면이 같지 않은 동전이라도 앞면 또는 뒷면이 나올 확률은 합은 1이 됩니다. 즉, 동전을 던지면 앞면과 뒤면 중에 반드시 한면은 나오므로 앞면이 나오는 사건과 뒤면이 나오는 사건의 합사건의 확률은 1이 됩니다.

따라서, 확률이 1인 사건은 반드시 발생하며, 그 반대인 확률 0인 사건은 발생하지 않습니다. 예를 들어, 동전 던지기에서 앞면과 뒷면이 아닌 다른 면이 나올 확률은 0입니다(혹은 0이라고 가정합니다).


2.3. 척도

척도(scale)는 어떤 변수를 측정할 때 사용되는 기준이나 체계를 의미합니다. 통계학에서 변수는 어떤 대상의 속성을 표현하는 값으로, 예를 들어 나이, 키, 체중 등이 있습니다. 이러한 변수를 측정할 때는 척도를 정의하고 그 척도를 사용하여 변수값을 관측합니다. 관측된 변수값을 데이터라고 부릅니다. 일반적으로 척도는 4가지 유형으로 구분됩니다.

명목척도(nominal scale)

명목척도는 변수의 구분을 위한 척도로, 서로 구별되는 범주(카테고리)를 사용합니다. 예를 들어, 성별, 혈액형, 학과 등이 명목척도에 해당합니다. 명목척도의 관측값은 서로 비교할 수 없으며, 오직 분류(카테고리화)의 목적으로 사용됩니다.

순서척도(ordinal scale)

순서척도는 명목척도로 관측대상을 분류한 범주의 순서 혹은 등위의 정보를 더하여 위한 척도입니다. 로, 명목척도와 마찬가지로 범주형 변수를 측정합니다. 예를 들어, 학생들의 성적 등급(상, 중, 하), 인기순위(1위, 2위, 3위…) 등이 순서척도에 해당합니다. 순서척도는 관측값 사이의 상대적인 크기 비교가 가능하지만, 각 관측값의 차이에 대해서는 정확한 의미를 가지지 않습니다.

간격척도(interval scale)

간격척도는 간격을 관측하는 척도입니다. 관측대상의 속성의 위치와 기준과의 간격을 관측하거나 두 관측대상의 속성의 위치의 간격을 관측하여 관측값을 나타냅니다. 간격의 관측값은 양적 데이터(수치형 데이터)입니다. 예를 들어, 섭씨 온도, 시간, 나이 등이 간격척도에 해당합니다. 간격척도는 순서척도의 특징을 포함하며, 각 관측값의 차이에 대해서 정확한 의미를 가지려면 두 관측대상의 속성이 공유하는 0점을 갖지 않는 경우가 많기 때문에 두 관측값의 비교나 여러 관측값간의 비례 계산에는 제한이 있을 수 있습니다.

비율척도(ratio scale)

비율척도는 간격척도의 특성에 더하여 절대적인 0점을 갖는 척도로, 관측값의 비율 계산이 가능합니다. 따라서 관측대상의 속성이 절대적인 기준이 있는 양으로 표현될 수 있는 경우에 사용합니다. 비율척도 기준으로는 “절대적 영점 (Absolute Zero)”을 사용합니다. 절대적 영점은 해당 측정값이 0일 때 해당 속성이 완전히 부재함을 나타내는 지점을 의미합니다. 비율척도로 관측하는 관측대상의 속성에는 무게, 길이, 속도, 가계수입 등이 있습니다. 예를 들어, 온도를 비례척도로 측정할 때, 켈빈(Kelvin) 온도 척도(scale)에서는 0 K (절대 영점)이 온도가 없음을 나타냅니다. 이러한 비율척도에서는 절대적 영점을 기준으로 양의 방향으로 측정값을 해석할 수 있습니다.

비율척도는 4가지의 척도 중에서 가장 높은 데이터(관측값)에 대한 분석이 가능한 수준입니다. 명목척도와 순서척도와 간격척도의 모든 특성을 갖고 있으며 더하여 절대적인 의미를 가지는 “0”점을 가지는 척도입니다. 비율척도는 관측대상의 속성이 크기를 가지며, 크기가 없는 0이 정의되고 크기의 기준인 1이 정의 되는 척도입니다. 따라서 관측대상의 속성이 크기가 있고 그 크기가 기준과 비교할 수 있는 경우에 사용되는 척도입니다. 따라서 비율척도로 관측한 여러 관측대상의 관측값의 비도 의미를 가지게 됩니다.

예를 들어, 어떤 제품의 무게를 측정하는 경우, 무게가 0인 상태(아무것도 없는 상태)를 절대적인 0점으로 정하고, 그 상태에서 관측된 무게 값들 사이의 비율을 계산할 수 있습니다. 즉, 이 경우에는 2kg의 무게가 1kg의 무게보다 2배 더 크다는 의미를 가집니다.

또한, 비율척도는 대부분의 수학적 연산이 가능합니다. 비율척도로 표현한 관측값은 덧셈, 뺄셈 뿐만 아니라 곱셈, 나눗셈의 연산이 모두 가능합니다. 따라서 비례척도로 구한 데이터(관측값)는 사칙연산을 사용하여 구하는 평균, 분산 등의 집단의 속성을 나타내는 측도를 계산할 때 사용할 수 있습니다. 정리하면 비율척도로 구한 개체의 데이터는 개체가 속한 집단의 측도를 계산하는 데 사용할 수 있고 원점이 같기 때문에 측도를 이용한 집단의 비교와 같은 통계적 분석이 가능합니다.

그러나 비율척도는 적용 가능한 변수가 제한적이라는 단점이 있습니다. 즉, 관측대상의 속성이 양을 가져야 하고 양의 기준인 “0”과 “1”이 존재해야 합니다. 또한 간격척도의 특성인 위치의 기준도 가지고 있어야 합니다.  이 때 간격척도의 위치 기준을 “0”으로 하고 비율척도의 양의 기준을 “0”과 “1”로 한다면 두 척도의 기준에 적용한 두 “0”사이의 관계를 명확히 나타낼 수 있어야 합니다. 예를 들어, 인간의 키는 비율척도로 관측할 수 있지만, 인간의 지능이나 인간의 성격 등의 변수는 크기의 “0”과 “1”을 정의하기가 어렵습니다. 따라서 인간의 지능이나 성격을 비율척도로 관측하려면 많은 조건이나 가정이 필요합니다. 즉, 어떤 개체의 속성을 분석하기 위해서는 비율척도를 적용하여 사칙연산이 가능한 데이터를 얻어야 합니다. 따라서 관측대상의 속성에 조건이나 가정을 제시하는 과정과 방법에 대한 많은 연구가 있게 됩니다.


2.4. 측도

측도(measure)란, 수학적으로 정의된 집합 위에 값을 부여하는 함수를 말합니다. 예를 들어, 실수 집합에서 정의된 함수 f(x)가 있을 때, 이 함수가 어떤 부분 집합 A의 원소 x에 대해 f(x) 값을 부여하면, 이 함수 f(x)는 집합 A 위에 측도를 정의한다고 말할 수 있습니다.

측도는 기하학, 확률론 등 다양한 분야에서 사용됩니다. 기하학에서는 크기를 가지지 않는 점의 위치를 표현하는 척도에 더하여 길이,  면적, 부피 등의 크기를 가지는 개념을 표현하는 데에 측도를 도입합니다. 확률론에서도 공간의 개념을 적용하여 확률공간에서 사건의 확률을 정의할 때 측도를 사용합니다. 확률은 크기(양)을 나타내며 공간상에서 확률의 분포를 표현할 때 측도로서의 확률이 적용됩니다. 또한 확률공간에 사건의 결과를 표현하는 집합은 공간에 출현하는 개체가 속한 집합이라고 할 수 있습니다. 여기서, 집합은 관측이나 분석의 대상에 따라 범주(category), 집단(group), 수준(level), 표본(sample), 모집단(population) 등의 용어로 대치될 수 있습니다.

측도는 다음과 같은 세 가지 조건을 만족해야 합니다.

1) 비음수성 (Non-negativity): 측도가 정의된 모든 집합에 대해 측도의 값은 0 이상이어야 한다.
2) 가법성 (Additivity): 서로소인 두 집합의 측도의 합은 합집합의 측도와 같아야 한다.
3) 치환 불변성 (Translation invariance): 집합에 대해 어떤 이동이 발생해도 측도의 값은 변하지 않아야 한다.


2.5. 측도로서의 확률

확률

확률(probability)은 사건(event)과 대응됩니다. 사건은 시행(try)이 있을 때마다 일어납니다. 예를 들어, “동전을 던져서 관측하기”라는 시행이 있으면 “윗면이 나오는 사건”과 “뒷면이 나오는 사건”이 일어납니다. 동전던지기 시행을 무한히 반복하면 각 사건의 통계적 확률을 구할 수 있습니다. 이 때 확률을 사건에 매칭하기 위해 표본공간(sample space)을 정의해야 합니다. 표본공간은 “일어나지 않는 사건”과 “모든 사건의 합사건”을 포함하여 일어날 수 있는 모든 사건이 원소인 집합입니다. 또한 동전을 개체(object)라고 한다면 사건은 개체를 관측하여(observe) 구한 개체의 속성이라고 할 수 있습니다. 동전을 관찰하면 동전이 앞면과 뒷면의 속성을 갖고 있음을 알 수 있습니다. 속성은 시행(try, test)의 결과를 관측하여(observe) 표현할 수도 있습니다. 따라서 사건은 개체가 나타내는 “범주형 속성”이라고 할 수 있습니다. 범주와 마찬가지로 사건도 집합으로 표현할 수 있습니다.

확률(probability)의 고전적 정의는 시행에서 가능한 모든 사건인 표본공간의 원소수에 대한 사건(event)의 원소수입니다. 여기서, 표본공간을 사건으로 대응하면 표본공간의 확률은 1이됩니다. 쉽게 말하면 시행에서 가능한 모든 경우의 수에 대한 사건이 가지는 경우의 수입니다. 확률은 시행에서의 모든 빈도에 대한 사건의 빈도인 “상대빈도”로도 설명할 수 있습니다.

확률공간

공간에는 범주가 있고 범주의 속성을 나타내는 측도에는 그 범주의 확률이 있습니다. 공간의 범주에 그 범주의 속성인 확률을 표현할 수 있으면 그 공간을 확률이 나타나는 공간인 확률공간(probability space)이라 합니다. 확률공간은 확률론에서 확률을 정의하는 데에 사용되는 수학적 개념입니다. 확률공간은 표본공간, 사건의 집합, 확률측도의 3요소로 이루어져 있어서 “triple”이라고도 불립니다. 표본공간, 사건의 집합, 확률측도가 모두 정의되면, 이를 이용하여 확률을 표현할 수 있습니다. 예를 들어, 동전 던지기에서 앞면이 나올 확률은 “P({앞면})”로 표현할 수 있습니다.

확률공간의 3요소

1. 표본공간(Sample space)

시행(try)의 가능한 모든 결과의 집합입니다. 예를 들어, 동전 던지기라는 시행에서 샘플 공간은 {앞, 뒤}입니다.

2. 사건공간(Event space)

사건공간은 사건의 집합입니다. 사건공간을 시그마-대수(Sigma- algebra)라고도 합니다. 사건공간은 표본공간의 부분집합의 집합으로서, 가능한 사건들의 집합입니다. 예를 들어, 동전던지기 시행(try)에서 가능한 시행의 결과인 사건(event)들은 {앞면}, {뒷면}, {앞면,뒷면}, {   }  등이 있습니다. 사건을 서술형으로 설명하면 {앞면}은 “주사위를 던져서 앞면이 나오는 사건”입니다. {뒷면}은 “주사위를 던져서 뒷면이 나오는 사건”입니다. 표본공간이기도 한 {앞면, 뒷면}은 주사위를 던져서 앞면 또는 뒷면이 나오는 사건”입니다. 공집합인 {   }은 “주사위를 던져서 앞면과 뒷면이 나오지 않는 사건”입니다. 사건의 집합은 다음과 같은 세 가지 조건을 만족해야 합니다.

1) 공집합과 표본공간은 사건공간의 원소이다.

2) 어떤 사건의 여집합(complement)도 사건공간의 원소이다.
3) 임의의 사건들의 합집합(union)도 사건공간의 원소이다.

3. 확률측도(Probability measure) : P

확률은 집합을 표현하는 측도 중의 하나입니다. P는 사건의 집합, A에 속하는 각각의 사건에 대한 확률 값을 정의한 이산형 함수(discrete function)입니다. 이 함수는 다음과 같은 세 가지 조건을 만족해야 합니다.

1) 모든 사건, A에 대해 P(A)는 0 이상의 실수이다.
2) 표본공간, S에 대해 P(S) = 1 이다.
3) 어떤 사건들의 합집합이 서로소일 때, 그들의 확률의 합은 전체 집합의 확률과 같습니다. 즉, $\rm{A_1, A_2, \ldots}$가 서로소인 사건들이고 이들의 합집합이 A일 때, $\rm{P(A) = P(A_1) + P(A_2) + \ldots}$이다.

사건의 서로소

두 집합이 서로소(disjoint, mutually exclusive)라고 하는 것은 두 집합이 공통된 원소가 없음을 의미합니다. 즉, 교집합이 원소가 없는 공집합임을 말합니다. 더 나아가 두 사건이 서로소라는 말은, 두 사건의 결과를 표현한 집합이 서로소임을 의미합니다. 두 집합의 교집합이 공집합임을 의미합니다. 이 때의 두 사건을 서로 배타적인 사건 또는 서로 교차하지 않는 사건이라고 합니다.

서로소는 확률론에서 매우 중요한 개념입니다. 두 사건이 서로소일 때, 이들의 확률의 합은 각 사건의 확률의 합과 같습니다. 즉, P(A ∪ B) = P(A) + P(B) 입니다. 이를 이용하여, 서로소인 사건들의 확률을 계산할 때, 사건들의 확률을 더하여 쉽게 계산할 수 있습니다. 예를 들어, 동전 던지기에서 “앞면이 나오는 사건”과 “뒷면이 나오는 사건”은 서로소입니다. 이는 “앞면이 나오는 사건”과 “뒷면이 나오는 사건”이 교집합을 가지지 않기 때문입니다. 또한, 두 집합이나 사건이 서로소일 때, 이들의 합집합은 각 집합의 크기의 합과 같습니다.

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.



3.2. 함수

=ROWS(F2:F2) : 지정된 배열 또는 범위에 있는 행의 개수.


3.3. 실습강의

– 실습강의 목차


4. 용어

4.1 용어


리커트 척도

리커트 척도는 그 발명자인 미국의 사회심리학자 Rensis Likert의 이름을 딴 심리측정 척도입니다. 이 척도는 연구 설문지에서 흔히 사용됩니다. 설문 연구에서 응답을 척도화하는 방식으로 가장 널리 사용되며, 때문에 ‘리커트 유형 척도(Likert-type scale)’라는 용어는 평가 척도(rating scale)와 종종 동의어로 사용되기도 하지만, 평가 척도에는 다른 유형들도 있습니다.

리커트는 척도 자체와 응답이 점수화되는 형식 사이를 구분하였습니다. 엄밀히 말하면, 리커트 척도는 전자만을 가리킵니다. 이 두 개념 사이의 차이는 리커트가 조사하려는 기본 현상과 그 현상을 나타내는 변동을 포착하는 방법 사이의 구분에서 나옵니다.

리커트 항목에 응답할 때, 응답자들은 일련의 진술에 대한 동의 또는 불일치의 수준을 대칭적인 동의-불일치 척도에서 지정합니다. 따라서, 척도는 주어진 항목에 대한 그들의 감정의 강도를 포착합니다.

척도는 개별 항목(질문) 세트에 대한 설문지 응답의 단순한 합계나 평균으로 생성될 수 있습니다. 이렇게 하면, 리커트 척도는 각 선택 사이의 거리가 동일하다고 가정합니다. 많은 연구자들은 높은 내적 일관성을 보이는 항목 세트를 사용하며, 동시에 연구 대상 전체 영역을 포착할 것이라고 가정합니다. 다른 연구자들은 “모든 항목이 서로의 복제본이라고 가정하거나 다시 말해 항목들이 병렬 도구로 간주된다”는 기준을 고수합니다. 반면, 현대의 시험 이론은 각 항목의 난이도를 항목 척도화에 포함시킬 정보로 간주합니다.

리커트 척도의 등간성에 대한 논의는 연구자들 사이에서 여전히 진행 중인 토론의 주제입니다. 일부 연구자들은 리커트 척도를 등간척도로 간주하여 적절한 통계 분석을 수행하며, 다른 연구자들은 그렇지 않다고 주장합니다.

특히 리커트 척도의 등간성을 수학적으로 증명한 구체적인 참고문헌을 제공하기는 어렵습니다. 이는 대부분의 연구가 통계적 또는 실증적인 근거를 기반으로 하는데, 수학적 증명 방식과는 다르기 때문입니다. 리커트 척도의 성질과 사용에 대한 더 깊은 연구나 이해를 원한다면, 측정 이론 (measurement theory) 또는 척도 이론 (scale theory) 관련 문헌을 참조하는 것이 좋습니다.

Reference

Likert scale – Wikipedia


자연상수 ?
Euler’s number ?

1. 애니메이션

1.1. Natural exponential    $y=e^x$

1.2. Gaussian function    $y=e^{-x^2}$


2. 설명

2.1. 복제와 자연상수

2.2. 붕괴와 자연상수

2.3. 재귀식과 자연상수

2.4. 미분방정식과 자연상수

2.5. 지수함수와 자연상수

2.6. 자연상수 성질

2.7. 자연상수 시각화

2.8. 자연상수 적용


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 용어

4.1. 용어

4.2. 참조

1. 애니메이션



Natural exponential    $y=e^x$




Gaussian function    $y=e^{-x^2}$

2. 설명

2.1. 복제(複製)와 자연상수

은행A는 예금자와 합의한 기간 동안 예금액을 복제해주는(2배로 불려 주는) 은행입니다. 다르게 표현하면 예금액에 더해 예금액과 같은 금액의 이자를 주는 은행입니다. 

$$Y=I+I\dfrac{T}{T}=2I$$

여기서 $Y$는 출금액

$I$는 예금액

$T$는 합의한 기간

예를 들어, 예금자와 은행이 합의한 예치기간을 1년으로하고 에금액을 1억으로 하면 합의한 기간인 1년 후에 예금자는 예금액의 2배인 2억을 출금할 수 있습니다. 다르게 표현하면 예금액 1억과 불려진 금액(이자)인 1억의 합이 출금액 2억원이 됩니다.

$$Y=1+1\dfrac{1}{1}=2 \,\, \text{억원}$$

은행B는 은행A와 마찬가지로 합의된 기간 동안 예금액을 2배로 불려주는데, 은행A와 다른 점은 합의된 예치기간내라도 출금을 할 수 있고 출금시 원금과 예치기간에 비례한 이자를 주는 은행입니다.

$$Y=I+I\dfrac{t}{T}$$

여기서 $Y$는 출금액

$I$는 예금액

$T$는 합의한 기간

$t$는 예치한 기간 ; $t  ≤ T$

예를 들어, 예금자와 은행이 합의한 예치기간을 1년으로 하고 1억을 예금하고 반년 후에 출금하면 예금 1억과 이자 0.5억원을 받습니다. 이를 다시 남은 반년간 예치하면 입금 1.5억과 이자 0.75억원을 받습니다. 정리하면, 합의한 기간을 반으로 나누어 입금과 출금을 연속적으로 진행하면 합의한 기간인 1년 후에 2.25억원을 받습니다.

$$Y=\left(1+1\cdot\dfrac{1}{2}\right) +\left(1+1\cdot\dfrac{1}{2}\right)\dfrac{1}{2}=\left(1+1\cdot\dfrac{1}{2}\right)^2 \text{억원}$$

위식을 일반화하면

$$Y=\left(I+I\cdot\dfrac{1}{n}\right)^n$$

여기서,  $Y$는 합의기간 후의 출금액

$I$는 처음 입금액

$n$은 1기간(표준화된 합의기간) 동안 “입금하고 출금하기” 회수

위 두가지 결과로 추론하면 예금자는 은행B를 선택하고 입금과 출금을 많이 하면 할수록 합의된 기간이 지난 후 더 많은 금액을 받을 수 있습니다. 또한, 입금과 출금을 연속적으로 반복하면 합의된 기간 후의 출금액은 수렴하며 최대출금액이 됩니다. 이를 다음식과 같이 일반화할 수 있습니다.  첫 입금액($I$)가 1이고 합의한 기간을 1로하면 출금액은 수렴하는 데 이 수렴값을 자연상수(Euler’s number, natural constant, $e$)라고 합니다. 자연상수($e$)는 무리수이며 정수, 2와 반복하지 않는 무한소수,  $0.718\cdots$의 합입니다.

$$Y=\lim_{n \to \infty} (I+I\cdot\dfrac{1}{n})^n=I^n e$$

여기서 $Y$는 합의기간 후 출금액

$I$는 처음 입금액

$n$은 “입금하고 출금하기” 횟수

위의 결과를 종합하면 정해진 1단위금액을 합의된 1단위시간동안 복제하는(2배로 만들어 주는) 은행이 있다면 1단위시간동안 입출금을 무한번 반복하면 1단위시간 후의 출금액은 수렴하며 가능한 최대출금액이 됩니다.


2.2. 붕괴(崩壞, decay)와 자연상수

방사성물질 A는 일정기간이 지나면 붕괴하는(질량이 반으로 주는) 물질입니다.

$$Y=I-\dfrac{I}{2}\dfrac{T}{T}=\dfrac{1}{2}I$$

여기서 $Y$는 반감기가 지난 후의 질량

$I$는 처음 질량

$T$는 반감기

예를 들어, 방사성물질 A가 반감기가 1년이고 처음 질량을 1g으로 하면 1년 후에 질량은 $\dfrac{1}{2}\mathrm{g}$이 됩니다.

$$Y=1-\dfrac{1}{2} \times \dfrac{1}{1}=\dfrac{1}{2}\mathrm{g}$$

방사성물질A가 연속적으로 붕괴하도록 하는 환경이 조성된다면 방사성물질A의 질량은 다음식으로 표현할 수 있습니다.

$$Y=\left(I-I\cdot\dfrac{1}{n}\right)^n$$

여기서 $Y$는 반감기가 지난 후의 질량

$I$는 처음 질량

$n$은 1기간(반감기) 동안 붕괴회수

붕괴회수를 극대화하면 다음과 같습니다.

$$Y=\lim_{n \to \infty} (I-I\cdot\dfrac{1}{n})^n=I^n e^{-1}$$

여기서 $Y$는 남은 질량

$I$는 처음질량 : $I$가 1이면 $Y$는 $e$로 수렴

$n$은 붕괴회수

위의 결과를 종합하면 처음 질량이 일정기간 동안 반이 되는 방사성원소가 있다면 그 기간동안 붕괴를 연속적으로 진행하면 붕괴 후의 질량은 수렴합니다. 이 때의 수렴된 값의 역수를 자연상수라 합니다. 자연상수는 무리수이며 $2.718\cdots$입니다.


2.3. 재귀식(recursive formula)과 자연상수

팩토리얼(factorial)은 다음과 같이 정의됩니다.

$$n!=n\times(n-1)\times, \ldots , \times 1$$

여기서, $n$은 0과 자연수이며 $0!=1$ 이고 $1!=1$

팩토리얼을 재귀식(recursive formula)으로 표현하면 다음과 같습니다.

$$f(0)=1$$

$$f(n)=n \times f(n-1) \,\, \text{for} \,\, n \gt 0$$

자연상수를 재귀식으로 표현하면 다음과 같고 $n$이 증가하면 자연상수에 가까워집니다.

$$e(0)=1$$

$$e(n)=e(n-1) \times \dfrac{1}{f(n)} \,\, \text{for} \,\, n \gt 0$$

자연상수를 무한급수형태의 재귀함수로 표현하면 다음과 같습니다.

$$e=\sum\limits_{n=0}^{n=\infty}\dfrac{1}{n!}$$


2.3. 미분방정식과 자연상수

다음 미분방정식은 미분값이 값의 배수와 같음을 나타내는 방정식입니다. 즉, $x$에 대한 $y$의 변화율이 $y$자신에 비례하는 모델입니다. 이러한 유형의 방정식은 자연 세계에서 많이 발견되며, 예를 들어 방사성붕괴나 인구성장 모델이 있습니다.

$$\dfrac{dy}{dx}=ky$$

여기서, $y$는 종속변수

$x$는 독립변수

$k$는 상수

이 미분방정식을 만족시키는 함수는 다음과 같습니다

$$y=Ce^{kx}$$

여기서, $e$는 자연상수

$C$는 초기 조건에 따라 결정되는 상수

$k$는 상수

자연상수는 이러한 유형의 미분방정식을 만족하는 지수함수에서 나타나며, 지수적 성장이나 감소를 모델링하는 데 중요한 역할을 합니다.


2.4. 지수함수와 자연상수

자신을 $x$번 곱해도 자신이 되는 수를 1로 정의하며 지수함수의 밑의 기준이 됩니다. 

$$1^x = 1$$

모든 실수는 자신을 0번 곱하는 것을 1로 정의하며 0은 지수함수의 지수의 기준이 됩니다.

$$a^0 \equiv 1$$

지수함수는 다음과 같이 표현합니다.

$$y=f(x)=a^x$$

여기서, $a$는 양의 실수

$x$가 0일 때의 $x$에 대한 $y$의 변화율(기울기)을 표현하면

$$f^{\prime}(0)=\lim\limits_{\Delta x \to 0}\dfrac{a^{0+\Delta x}-a^0}{\Delta x}=\lim\limits_{\Delta x \to 0}\dfrac{a^0(a^{\Delta x}-1)}{\Delta x}=a^0\left(\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}\right)=\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}$$

여기서,  $\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}$는 수렴

$a=2$이면 $\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}=0.6931472\cdots$

$a=3$이면 $\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}=1.0986123\cdots$

$f^{\prime}(0)=a^0\cdot \ln a=1$일 때의 $a$를 구하면 $a$는 $2.718\cdots$인 무리수이며 이를 자연상수 $e$라고 합니다.

$$\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}=1$$

여기서,  $a$는 $2.718\cdots$인 무리수이며 자연상수

지수함수의 미분함수(도함수)를 일반화하면

$$f^{\prime}(x)=\lim\limits_{\Delta x \to 0}\dfrac{a^{x+\Delta x}-a^x}{\Delta x}=\lim\limits_{\Delta x \to 0}\dfrac{a^x(a^{\Delta x}-1)}{\Delta x}=f(x)\left(\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}\right)=f(x)g(a)$$

여기서, $a^{x+\Delta x}=a^{x} a^{\Delta x}$

$0 < a$

$g(a)$는 $\lim\limits_{\Delta x \to 0}\dfrac{a^{\Delta x}-1}{\Delta x}$이며 $a$에 따라 다른 값으로 수렴하는 함수


2.5. 자연상수 (Natural constant, $e$) 성질

자신을 $x$번 곱해서 나오는 값이 $x$에서의 기울기인 수가 자연상수 $e$입니다. 자연상수($e=2.718\cdots$)는 무리수입니다. $e$를 $x$번 곱해서 나오는 값인  $e^x$을 두 변수, $x$와 $y$가 이루는 직교좌표계에서 함수로 표현하면

$$y=f(x)=e^x$$

원함수를 미분하여 표현하면

$$\dfrac{dy}{dx}=f^{\prime}(x) =\dfrac{d(e^x)}{dx} = e^x$$

원함수를 적분하여 표현하면

$$\int ydx=F(x)=\int_{-\infty}^{x}e^tdt= e^x$$

여기서,  $\lim\limits_{x \to -\infty} e^x=0$

원함수와 미분함수와 적분함수가 모두 같습니다. 모두 자연상수가 밑이 되는 지수함수입니다. 자연상수를 밑으로 하는 지수함수, 즉, 자연 지수함수는 정의역에 따라 다음과 같이 표현할 수 있습니다.

$$f(x)=e^x$$

여기서,  $x < 0$ 이면  $f(x)=\left(\dfrac{1}{e}\right)^{ㅣxㅣ}$

$x = 0 $ 이면  $f(x)= 1$

$x > 0$ 이면  $f(x)=e^x$

단위기간을 나눈 무한횟수($n$)로 표현하면

$$e=\lim_{n \to \infty} \left(1+{\dfrac {1}{n}}\right)^{n}$$

단위기간의 나누어진 극소시간($t$)로 표현하면

$$e=\lim_{t \to 0} \left(1+t\right)^{\frac{1}{t}}=e$$

자연상수를 급수(series)로 표현하면

$$\eqalign{e=\sum_{n=0}^{\infty}\dfrac{1}{n!} &= \dfrac{1}{0!} + \dfrac{1}{1!} + \dfrac{1}{2!} + \dfrac{1}{3!} + \cdots \cr&= \dfrac{1}{1} + \dfrac{1}{1} + \dfrac{1}{1\cdot 2} + \dfrac{1}{1\cdot 2\cdot 3} + \cdots}$$

자연로그와의 관계는 

$${\rm ln}\left(e^x\right) = x \,\, , \,\, e^{{\rm ln} (x)} = x$$

가우스 적분

$$\int_{-\infty}^{\infty}e^{-x^2}dx=\sqrt{\pi}$$

임의의 가우스적분(arbitrary Gaussian function)

$$\int _{-\infty }^{\infty }e^{-a(x+b)^{2}}\,dx=\sqrt {\dfrac {\pi }{a}}$$

베르누이 시행

$$\binom {n}{k}\left({\dfrac {1}{n}}\right)^{k}\left(1-{\dfrac {1}{n}}\right)^{n-k}$$

베르누이 시행에서 $k$가 0이고 $n$이 무한대이면

$$\lim\limits_{n \to \infty} \left(1-{\dfrac {1}{n}}\right)^{n}=\dfrac{1}{e}$$

로그함수 미분

$$\dfrac {d}{dt}\log _{e}t=\dfrac {1}{t}$$

로그함수 적분

$$\int _{1}^{e}{\dfrac {1}{t}}\,dt=1$$

자연 지수함수의 생성상수가 $\tau$일 때

$$\tau =\dfrac{f(t)}{f'(t)}$$

$$f(t+\tau )=ef(t)$$


2.6. 자연상수 시각화

극좌표계

극좌표계에서 원점에서의 거리, $r$이 시간($t$)에 따라 지수함수적으로 작아지고 각속도($\dot{\theta}$)가 상수인 $2\pi$로 등속일 때 2차원 평면에서 점의 움직임을 수식으로 표현하면 다음과 같습니다.

$$\dfrac{dr}{dt}= \left(\dfrac{1}{e}\right)^t$$

여기서, 시간($t$)는 0에서 시작하여 커지는 실수

점의 각속도

$$\dfrac{d\theta}{dt}=2\pi$$

여기서, 시간($t$)는 0에서 시작하여 커지는 실수. 그리고 $\theta$는 직각좌표계의 $x$축 방향에서 시작

직각좌표계

점의 $x$축에서의 출현 횟수는 단위시간 1당 1번

$$\dfrac{dl}{dt}=2{\pi}e^t$$

여기서,  $\dfrac{dl}{dt}=2{\pi}\dfrac{dr}{dt}$

모든 각도에서 점이 무한대로 있고 운동하면


2.7. 자연상수 적용

복리 적금

리 적금의 원금과 이자의 합계(원리 합계)는 다음의 식과 같이 계산할 수 있습니다.

 

원리합계 = 원금 × (1 + 이자율)기간

 

원리합계는 원금과 이자율과 기간이 결정한다는 것을 알 수 있습니다. 기간이 무한하게 커져도 원리합계가 수렴하는 경우는 이자율과 기간이 서로 반 비례하는 경우입니다. 

미분방정식으로 표현하면

$$\dfrac{dM}{dt}=(1+r)M$$

여기서,  $M$은 $t$의 함수이며 $M(t)$는 $t$시간이 흐른 후 찾을 수 있는 금액

$r$은 이자율

미분방정식을 풀면

$$M(t)=e^{(1+r)t}$$

여기서,  $M$은 $t$의 함수이며 $M(t)$는 $t$시간이 흐른 후 찾을 수 있는 금액

$r$은 이자율

자기복제

우선, 이산적(discrete)인 경우의 자기복제를 생각해 봅니다. 초기량를 1이라 하고 단위 복제 기간을 1이라고 한다면 1기간 후에는 자신의 초기량의 2배인 2가 됩니다.  복제가 연속적(continuous)으로 진행되는 경우는 복제가 진행되는 기간을 1 이라고 한다면 1기간 후에는 다음식과 같이 총량이 만들어 집니다.  총량은 초기량과 복제된 량의 합입니다.

 

$$\mathop{\lim}\limits_{{t}\rightarrow{o}}{\left({{1}{+}{t}}\right)}^{\frac{1}{t}}{=}\mathop{\lim}\limits_{{n}\rightarrow\infty}{\left({{1}{+}\frac{1}{n}}\right)}^{n}$$

 

이 값의 최대값은 단위 1기간을 무한개의 기간으로 나누면  $e$로 수렴합니다.

 

$$\mathop{\lim}\limits_{{t}\rightarrow{o}}{\left({{1}{+}{t}}\right)}^{\frac{1}{t}}{=}\mathop{\lim}\limits_{{n}\rightarrow\infty}{\left({{1}{+}\frac{1}{n}}\right)}^{n}=e$$

 

정리하면, 크기 1이 1기간 동안 생성률(미분계수) 1로 시작하여  무한 자기복제를 하면 수렴하게 되는데  그 값이 자연상수($e$)입니다. 자연상수($e$)는 무리수 입니다. 

 

$e = 2.71828…$

 

$${e}{=}\mathop{\lim}\limits_{{t}\rightarrow{o}}{\left({{1}{+}{t}}\right)}^{\frac{1}{t}}{=}\mathop{\lim}\limits_{{n}\rightarrow\infty}{\left({{1}{+}\frac{1}{n}}\right)}^{n}$$

온도평형

방안의 온도와 방안에 있는 찻잔 속의 뜨거운 물의 온도차이를 $\Delta T$라 하면 온도차이의 시간이 지남에 따라 줄어드는 속도는 온도차이에 비례합니다.

$$\dfrac{d\Delta T}{dt}=-k\Delta T$$

여기서,  $\Delta T$는 방안의 온도와 뜨거운 물의 온도차

자연에서 온도차($\Delta T$)는 다음식과 같이 관찰됩니다.

$$f^{\prime}(t)= -k f(t)$$

여기서, $f(t)=\Delta T$

$t$는 시간

$k$는 주어지는 상수

위의 함수  $f(t)$를 지수함수($a^t$)로 모델링할 수 있습니다.

$$f^{\prime}(t)=\lim\limits_{\Delta t \to 0}\dfrac{a^{t+\Delta t}-a^t}{\Delta t}=\lim\limits_{\Delta t \to 0}\dfrac{a^x(a^{\Delta t}-1)}{\Delta t}=f(t)\left(\lim\limits_{\Delta t \to 0}\dfrac{a^{\Delta t}-1}{\Delta t}\right)=-kf(t)$$

여기서,  $0<a≤1$

$k=-\lim\limits_{\Delta t \to 0}\dfrac{a^{\Delta t}-1}{\Delta t}$이며 $a$에 대한 함수

 $a$를 $e^{\ln a}$로 대치하면

$$f(t)=\Delta T(t)=e^{-kt}$$

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


생성단위 자연상수 e : 구글시트 실습

3.2. 구글시트 함수

=EXP(1) : 자연상수 e의 거듭제곱. 괄호안의 숫자는 거듭제곱할 지수. 

=FACT(A3) : 계승. A3에 있는 값보다 작거나 같은 모든 양의 정수의 곱. 예를 들어, A3가 3이라면, 3의 계승은 3, 2, 1의 곱, 즉, $(3\times 2\times 1)$이 됨.

=2^2 : 거듭제곱. 2를 2번 곱함.

=LN(2) : 자연로그. 자연상수 e를 밑으로 하는 자연로그 값. e를 몇 제곱해야 2가 되는지 계산함. 따라서, =LN(EXP(1))의 값은 1이 됨.


3.3. 실습강의

자연상수 e

구글시트 함수로 e 구하기

복리계산식으로 e 구하기

베르누이의 공식으로 e 구하기

테일러 전개로 e 구하기

지수함수

실습 안내


4. 용어

4.1 용어


e (자연상수, mathematical constant)

오일러 수(Euler’s number)라고도 하는 상수 $e$는 대략 2.71828과 같은 수학적 상수로 여러 측면에서 규정될 수 있습니다. 자연로그의 밑입니다. $n$이 무한대에 가까워질 때의  $(1 + \dfrac{1}{n})^n$의 극한값입니다. 복리계산에서 보이는 표현입니다. 무한급수의 합으로 계산할 수도 있습니다.

 

또한 $e$는 함수 $y = ax$의 그래프가 $x = 0$에서 기울기가 1이 되도록 하는 고유한 양의 상수입니다. (자연)지수 함수 $f(x) = e^x$는 고유한 함수 $f$가 도함수와 동일하고 방정식 $f(0) = 1$을 충족합니다. 따라서 $e$를 $f(1)$로 정의할 수도 있습니다. 자연로그 또는 밑이 e인 로그는 자연 지수 함수의 역함수입니다. 숫자$k > 1$의 자연로그는 $x = 1$과 $x = k$사이의 곡선 $y = \dfrac{1}{x}$ 아래의 면적으로 직접 정의할 수 있습니다. 이 경우 $e$는 이 면적이 1일 때의  $k$의 값입니다.

 

상수 $e$는 수학자 Leonhard Euler의 이름을 따서 Euler’s number 또는 John Napier의 이름에서 Napier의 상수라고 합니다. 이 상수는 복리를 연구하던 중 스위스 수학자 Jacob Bernoulli가 발견했습니다. 상수 $e$는 $0$, $1$, $\pi$ 및 $i$와 함께 수학에서 매우 중요한 수입니다. 숫자 5개 모두 오일러의 항등식 $e^{i\pi }+1=0$에 나타나며 수학 전반에 걸쳐 사용됩니다. 상수 ${\pi}$와 마찬가지로 $e$는 무리수(정수 비율로 나타낼 수 없음)이고 초월적(유리계수가 있는 0이 아닌 다항식의 근이 아님)수입니다. 소수점 이하 50자리까지 $e$의 값은 다음과 같습니다.

2.71828182845904523536028747135266249775724709369995…

 

Reference

e (mathematical constant)


Product Integral

  additive multiplicative
discreate $$\sum_{i=a}^{b}f(i)$$ $$\prod_{i=a}^{b}f(i)$$
continuous $$\int_{a}^{b}f(x)dx$$ $$\prod_{a}^{b}f(x)^{dx}$$

곱의 적분(product integral)은 미적분학의 일반적인 합의 적분과 상대되는 적분입니다. 곱의  적분은 1887년 수학자 Vito Volterra가 선형 미분 방정식 시스템을 풀기 위해 개발했습니다. 곱의 적분은 유행병학, 통계역학, 양자역학에 이르는 영역에서 사용됩니다. Geometirc 적분은  Geometric 도함수와 함께 이미지 분석 및 성장(growth)/쇠퇴(decay) 현상(예: 경제 성장, 박테리아 성장 및 방사성 붕괴) 연구에 유용합니다.Bigeometric 적분은 Bigeometric  도함수와 함께 프랙탈의 일부 응용과 경제학의 탄력성 이론에서 사용합니다.

 

Reference

Product integral – Wikpedia


Gausian Integral

오일러-푸아송 적분으로도 알려진 가우시안 적분은 가우시안 함수인 $f(x)=e^{-x^{2}}$의 실수에서의 적분입니다. 이 적분은 독일 수학자 칼 프리드리히 가우스의 이름을 따서 명명되었습니다.

$$\int _{-\infty }^{\infty }e^{-x^{2}}\,dx=\sqrt {\pi}$$

Abraham de Moivre는 1733년에 이러한 유형의 적분을 발견했으며, Gauss는 1809년에 이 적분을 발표했습니다. 이 적분에는 광범위한 응용 분야가 있습니다. 예를 들어, 약간의 변수 변경으로 정규 분포의 정규화 상수를 계산하는 데 사용됩니다. 정적분은 정규분포와 누적분포함수의 오류함수와 밀접한 관련이 있습니다. 예를 들어, 물리학에서 이러한 적분은 양자역학에서 조화 발진기의 기저 상태의 확률 밀도를 표현할 때 나타납니다. 이 적분은 또한 경로 적분 공식에서 고조파 발진기의 전파자를 찾기 위해, 그리고 통계역학에서 분할함수를 찾을 때 사용됩니다. 임의의 가우스 함수의 정적분은 다음과 같습니다.

$$\int _{-\infty }^{\infty }e^{-a(x+b)^{2}}\,dx=\sqrt {\dfrac {\pi }{a}}$$

Reference

Gaussian integral – Wikipedia


원주율(π) ?

1. 애니메이션

1.1. 회전단위 원주율


2. 설명

2.1. 회전단위 원주율

2.2. 확률분포에서의 원주율


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 용어

4.1. 용어

4.2. 참조

1. 애니메이션



회전단위 원주율 파이(pi, π)

2. 설명

2.1. 회전단위 원주율

원주율($\pi$)

원주(원의 둘레, circumference)와 지름(diameter)의 비는 항상 일정합니다. 또한 원의 면적과 반지름(radius)의 제곱의 비도 항상 일정합니다. 그 비를 원주율이라고 부르며 상수입니다. 원주율은 그리스문자, $\pi$(pi)로 표기합니다. $\pi$는 무리수이며 십진법으로 표현하면, 정수인 3과 반복하지 않는 무한소수(無限小數, infinite decimal)인 0.141592..의 합입니다. 원주의 길이는 지름의 길이의 3배에서 4배사이라고 고대부터 알고 있었습니다. 이 지식은 수레바퀴의 회전수로 수레가 이동한 거리를 구할 때 사용하였습니다.

 

원주율($\pi$)은

$$\pi=\dfrac{l}{2r}$$

여기서,  $l$은 원주

$r$은 원의 반지름

원주($l$)는

$$l=2\pi r$$

여기서,  $l$은 원주

$\pi$는 원주율

$r$은 원의 반지름

지름 1인 원의 원주는 $\pi$이고 반지름이 1인 원의 원주는 $2\pi$입니다.

각도의 단위 : radian(라디안)

호(arc)는 원주(원의 둘레, circumference)의 일부분으로, 원주상의 두 점 사이 곡선입니다. 호는 원주상의 두 점과 원(circle)의 중심에 의해 정의됩니다. 이 두 점은 호의 끝점이라고 하며, 원의 중심에서 이 두 점을 잇는 선분들은 각도(angle)를 형성합니다. 호의 길이는 원의 반지름과 중심각(호를 둘러싸는 각도)에 의해 결정됩니다. radian은 호(원주의 부분, arc)를 반지름으로 표준화한 값이며 각도를 표현할 수 있습니다.

$$\text{radian}=\dfrac{a}{r}$$

여기서,  $a$은 호(arc)

$r$은 원의 반지름

1 radian은 호(각도가 차지하는 원주)와 반지름의 길이가 같을 때 값입니다. radian은 각도의 단위로 사용되며 rad로 표기합니다. 중심각이 라디안 단위로 주어진 경우, 호의 길이는 반지름과 중심각의 곱입니다. 예를 들어, 반지름이 $r$이고 중심각이 $\theta$ rad인 원의 호의 길이는 $r\cdot\theta$입니다. 원주를 이루는 모든 점의 회전각을 모두 더하면 한 회전이 됩니다. 그리고 호의 radian은 호를 이루는 점들의 회전의 적분값이라고 할 수 있습니다.

각속도의 단위

회전(rotation)은 점의 방향이 변하여 처음과 같은 방향으로 돌아오는 것을 말합니다. 한 회전의 각도는 2$\pi$ rad 입니다.

$$\text{1회전}=2\pi \mathrm{rad}$$

회전량의 단위는 각도의 단위와 같으며 1회전을 360진법으로 나타내는 degree(도)와 2$\pi$ 로 나타내는 radian이 있습니다. 360 degree는 2$\pi$ rad에 해당합니다. 회전속도(각속도)의 단위는 rad/sec입니다. $\pi$와 각도의 단위, radian은 회전의 속도인 주파수에 사용됩니다. 예를 들면, 1초 동안 한 번 회전하면 2$\pi$ rad/sec입니다. 한편, 1초 동안 1번 회전하면 1 Hz(헤르츠)입니다.  따라서 2$\pi$ rad/sec는 1Hz입니다.


2.2. 확률분포에서의 원주율($\pi$)

확률모델에서는 개체를 점(point)으로 표현합니다. 개체의 속성을 확률변수로 하여 생성되는 점의 위치를 확률변수값으로 모델링합니다. 그리고 속성이 출현하는 빈도의 비를 확률로 표현하는 데 그 위치에서의 회전속도로 모델링합니다. 개체의 속성이 이산적인 경우는 그 위치에서의 점의 회전속도를 확률질량으로 모델링하고 개체의 속성이 연속형인 경우에는 확률밀도로 모델링합니다. 다르게 표현하면 확률모델에서는 확률변수(위치)에서의 개체(object)의 출현주기의 비(확률질량비 또는 확률밀도 비)는 각 위치에서의 회전속도와 비례한다는 모델을 만들 수 있습니다. 한편, 통계모델에서는 개체를 표집(sampling)하는 주기(sampling frequency)가 개체가 생성되는 주기와 같다고 모델링할 수 있습니다.

원주로 표현되는 기하학적인 양

원의 반지름 원의 지름 원의 둘레 원의 면적 구의 표면적 구의 체적
$r$ $2r$ $2\pi r$ $\pi r^2$ $4\pi r^2$ $\frac{4}{3}\pi r^3$

원형균등분포(circular uniform distribution)

총 확률질량 1을 원의 면적으로 모델링합니다. 평균은 원의 중심점의 위치입니다. 원형균등분포에서 각 점의 확률밀도는 원의 면적에 반비례합니다. 따라서 확률밀도함수는 다음과 같습니다.

$$f(r, \theta)=\dfrac{1}{\pi R^2}$$

여기서, $r$은 반지름이며 실수인 연속형 확률변수

$\theta$는 각도이며 실수인 연속형 확률변수

$R$은 반지름이며 실수인 주어진 값(상수)

지지집합(support)인 확률이 존재하는 구간은 $0 \leq R$ 이고 $0 \leq \theta \lt 2\pi$

분산이 1인 2차 원형균등분포(circular uniform distribution)

2차원 원형균등분포의 경우, 서로 독립인 $x$축(가로축)과 $y$축(세로축)에 대한 분산은 $\left(\dfrac{1}{2}r\right)^2$입니다. 따라서 분산이 1이 되려면 $r$은 2가 되어야 합니다. 확률밀도함수는 다음과 같습니다.

$$f(x, y)=\dfrac{1}{4\pi}$$

지지집합(support)인 확률이 존재하는 구간은 $x^2+y^2 \leq 2^2$을 만족하는 $(x, y)$ 

1차원 표준정규분포

1차원 표준정규분포에서 원주율($\pi$)은 확률밀도함수(probability density function, pdf)에서 정규화 요소 $\sqrt{2\pi}$에 포함되어 있습니다. 정규화요소는 확률밀도함수를 확률변수의 모든 실수에 대해 적분했을 때 그 결과가 1이 되도록 보장합니다. 1차원 표준정규분포의 확률밀도함수(pdf)는 다음과 같습니다. 

여기서, $x$는 확률변수

는 자연상수

는 원주율

2차원 표준정규분포

2차원 표준정규분포는 두 독립적인 1차원 표준정규분포의 곱으로 표현될 수 있습니다. 2차원 표준정규분포에서 원주율($\pi$)은 확률밀도함수(probability density function, pdf)에서 정규화 요소 ${2\pi}$에 포함되어 있습니다. 정규화요소는 확률밀도함수를 두 확률변수의 모든 실수에 대해 적분했을 때 그 결과가 1이 되도록 보장합니다. 2차원 표준정규분포의 확률밀도함수(pdf)는 다음과 같습니다. 

여기서, $x$와 $y$는 서로 독립인 확률변수

는 자연상수

는 원주율

$x^2+y^2$은 $r^2$

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.



3.2. 구글시트 함수

=PI() : 파이(pi) 값. 소수점 이하 14자리까지의 파이(pi)값을 표시.

=RADIANS(180/100) : 360도 중 도 단위를 라디안으로 변환. 180/100, 즉 1.8도를 라디안으로 변환.

=SIN(RADIANS(180/100)) : 라디안으로 입력된 각도의 사인. 180/100, 즉 1.8도를 라디안으로 변환 후, 사인값을 표시.

=SUM(C:C) : 합계. C열에 있는 모든 데이터의 합계를 표시.

=SQRT(6*SUM(C:C)) : 제곱근. C열에 있는 모든 데이터를 더한 값에 6을 곱한 후, 제곱근을 구함.


3.3. 실습강의

파이(pi, π)

구글시트 함수로 파이 구하기

정사각형의 둘레로 파이 구하기

라이프니츠의 공식으로 파이 구하기

오일러의 곱셉 공식으로 파이 구하기

실습 안내


4. 용어

4.1 용어


원주율

숫자에서 무리수인 π(원주율, 파이로 읽음)는 원의 둘레($l$)와 지름($r$)의 비율인 수학 상수로 대략 $3.14159\cdots$와 같습니다. 무리수 π는 수학과 물리학 전반에 걸쳐 많은 공식에 나타납니다. 22/7과 같은 분수로 일반적으로 근사화하여 사용하지만 이는 무리수입니다. 즉, 두 정수의 비율로 정확하게 표현할 수 없습니다. 결과적으로 십진수로 표현할 때 자리수가 끝나지 않고 영구적으로 반복되는 패턴입니다. 원주율은 초월수로서 합, 곱, 거듭제곱, 정수만을 포함하는 방정식의 해가 될 수 없음을 의미합니다. π의 초월은 나침반과 직선자로 원을 제곱하는 고대의 과제를 해결하는 것이 불가능하다는 것을 의미합니다. π의 십진수는 무작위로 분포된 것으로 보이지만 이 추측에 대한 증거는 아직 발견되지 않았습니다.

 

수천 년 동안 수학자들은 π의 값을 높은 정확도로 계산함으로써 π에 대한 이해를 넓히려는 시도를 해왔습니다. 이집트와 바빌로니아를 포함한 고대 문명은 실제 계산을 위해 상당히 정확한 π의 근사값을 필요로 했습니다. 기원전 250년경에 그리스 수학자 아르키메데스는 임의의 정확도로 π를 근사하는 알고리즘을 만들었습니다. 서기 5세기에 중국 수학자들은 π를 7자리로 근사하였고 인도 수학자들은 기하학 기술을 사용하여 5자리의 근사값을 구했습니다. 무한급수를 기반으로 하는 π에 대한 첫 번째 계산 공식은 천년 후에 발견되었습니다. 원의 둘레와 지름의 비율을 나타내기 위해 그리스 문자인 π의 최초의 사용은 1706년 웨일스의 수학자 William Jones가 사용한 것으로 알려져 있습니다.

 

미적분학의 발전은 모든 실용적인 계산에 충분한 π의 수백 자리의 계산으로 이어졌습니다. 그럼에도 불구하고, 20세기와 21세기에 수학자와 컴퓨터 과학자들은 증가하는 계산 능력과 결합하여 π의 십진법 표현을 수조 자릿수로 확장하는 새로운 접근 방식을 찾았습니다. 이러한 시도는 급수를 계산하기 위한 효율적인 알고리즘의 개발과 자리수 기록을 깨려는 인간의 탐구에 의해 동기가 부여되었습니다. 슈퍼컴퓨터를 테스트하는 데에도 사용되었습니다.

 

원주율의 정의는 원과 관련이 있기 때문에 π는 삼각법 및 기하학의 많은 공식, 특히 원, 타원 및 구와 관련된 공식에서 발견됩니다. 또한, 우주론, 프랙탈, 열역학, 역학, 전자기학과 같은 과학의 여러주제의 공식에서도 발견됩니다. 현대의 수학적 분석에서는 기하학에 대한 참조 없이 대신 정의되는 경우가 많습니다. 따라서 정수론이나 통계와 같이 기하학과 거의 관련이 없는 영역에서도 나타납니다. π의 넓은 효용성은 π를 과학 안팎에서 가장 널리 알려진 수학 상수 중 하나로 만듭니다. π에 관한 많은 책이 출판되었으며 최대기록의  π의 자릿수 계산은 종종 뉴스 헤드라인을 장식합니다.

 

Reference

Pi – Wikipedia


4.2. 참조


Reference

Pi – Wikipedia

기준과 단위 ?

1. 애니메이션

1.1. 3차원(공간) 단위


2. 설명

2.1. 기준(0)과 단위(1)


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 용어

4.1. 용어

1. 애니메이션



3차원 단위

2. 설명

2.1. 기준(0)과 단위(1)

0은 아무것도 없다는 관념적인 기준입니다. 현실에서도 아무것도 존재하지 않는 상태를 기준으로 사용하는 경우가 많이 있습니다. 0은 자신을 아무리 더해도 자신이 됩니다.

 

0과 대비되어 나온 1은  “있다”라는 의미입니다. 역시 관념적인 단위입니다. 1은 자신을 아무리 곱해도 자신이 되지만 더하면 더하는 횟수만큼 값이 늘어나게 됩니다. 그래서  “1”은 곱하기의 기준이 되고 더하기의 단위가 됩니다. 그리고  0과 1사이의 값과 1이상의 값의 경계인 1은 곱하기와 나누기의 경계가 됩니다.

한편, 0은 양수와 음수의 경계, 즉 더하기와 뺴기의 경계가 됩니다.

 

0과 1에 물리적인 단위가 붙으면 우리가 인지할 수 있는 단위가 됩니다.

길이 단위로는 meter, 질량단위로는 gram등이 있습니다. 이것은 합의하여 정한 것입니다. 단위가 있으면 기준이 있어야 하는데 이 또한  단위를 사용하는 주체의 합의가 있어야 합니다.

 

점(point)이 모여서 선(line)이 됩니다.

점(point)의 길이는 0입니다.

선은 단위(unit)가 있습니다.

선은 1차원(dimension)입니다.

선의 단위는 1 하나로 이루어 집니다.

 

선(line)이 모여서 면적(area)가 됩니다.

선(line)의 면적은 0입니다.

면적은 단위(unit)가 있습니다.

면적은 2차원(dimension)입니다.

면적의 단위는 1, 1 두개로 이루어 집니다.

 

면적(area)이 모여서 부피(volume)가 됩니다.

면적(area)의 부피는 0입니다.

부피는 단위(unit)가 있습니다.

부피는 3차원(dimension)입니다.

부피의 단위는 1, 1, 1 세개로 이루어 집니다.

 

 

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


차원단위 : 구글시트 실습

3.2. 함수

=TRANSPOSE(C3:C5) : 지정한 범위에 있는 데이터의 행과 열을 바뀜. C3와 C5에 있는 데이터는 열로 구성이 되는데, 이를 행으로 바꿈. 전치행렬을 만들 때 사용할 수 있음.

=MMULT(C3:C5,E3:G3) : 범위로 지정한 두 행렬의 곱. C3에서 C5에 있는 행렬과 E3에서 G3에 있는 행렬의 곱을 계산해서 구함.


3.3. 실습강의

– 데이터

– 당도의 제곱

– 당도 편차의 제곱

– 당도 편차와 과중 편차의 곱


4. 용어

데이터 선택과 분리 ?
Data selection and separation ?

1. 애니메이션

1.1. 데이터 선택

1.2. 데이터 분리


2. 설명

2.1. 데이터 선택과 분리


3. 실습

3.1. 구글시트

3.2. 구글시트 함수

3.3. 실습강의


4. 용어와 수식

4.1. 용어


1. 애니메이션



데이터 선택




데이터 분리


2. 설명

2.1 데이터 선택과 분리

데이터를 살펴보면 첫번째 열은 요소명입니다. 즉, 딸기의 당도를 측정할 때 부여한 딸기 번호입니다. 그래서 딸기의 특성을 나타내는 데이터가 아닌 측정편의상 부여한 것입니다.

 

필요한 데이터를 분리하면 변수명인 당도와 20개의  변수값인 데이터입니다. 20개의 당도 데이터와  딸기개수로 총 21개의 데이터를 분리해 내었습니다. 즉, 데이터 개수인 20이라는 숫자도 중요한 데이터로 취급됩니다. 데이터를 분리하여도  당도라는 변수명은 그대로 사용합니다.


3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.



3.2. 구글시트 함수

=SUM(B3:B22) : 합계. 


3.3. 실습강의

데이터 복사

데이터 참조



4. 용어와 수식

4.1 용어

정형데이터 ?
Structured data ?

1. 애니메이션

1.1. 정형데이터의 요소(element)

1.2. 정형데이터의 변수(variable)

1.3. 정형데이터의 요소명과 변수


2. 설명

2.1. 정형데이터

2.2. 척도와 속성의 대응


3. 실습

3.1. 구글시트

3.2. 함수

3.3. 실습강의


4. 참조

4.1. 용어

4.2. 참고문헌

1. 애니메이션



정형데이터의 요소(element)




정형데이터의 변수(variable)




정형데이터의 요소명과 변수




정형데이터

2. 설명

2.1 정형데이터

정형데이터는 개체의 속성을 관측한 결과를 데이터시트로 표현한 것이라고 할 수 있습니다. 정형데이터는 관측된 각 개체와 개체의 속성이 특정하는 칸이 쌓여있는 모습을 나타냅니다. 관측된 각 개체는 고유이름인 ID로 구분되며 개체의 속성은 변수로 취급됩니다. 따라서 개체의 속성명은 변수명과 같습니다. 관측한 변수값(variable value)을 데이터(data)라고 합니다. 각 개체의 개체명과 그 개체의 속성의 관측값을 요소(element), 기록(record), 예(example) 등이라 하며 행(row)으로 표현합니다. 개체의 속성을 변수로 보면 개체의 속성명은 변수명이 되고 각 개체의 속성을 관측한 결과는 변수값이 됩니다. 개체의 속성은 변수로 모델링됩니다. 따라서 개체의 속성은 하나의 변수명과 여러 변수값으로 구성된 열(column)로 표현됩니다.

 

정형데이터는 계열(series, sequence, family)이 모여있는 집합이라고 할 수 있습니다. 계열은 “열(column)”로 표현한 변수를 말합니다. 변수(variable)는 변수명(variable name)과 변수값(variable value)로 구성되어 있습니다. 특별히 시계열(time series)은 변수값과 관측한 시각정보가 대응되어 있고 차순으로 정리되어 있는 계열을 말합니다.

 

정형데이터는 요소(element)가 모여 있는 집합이라고 할 수 있습니다. 요소는 가로줄 “행”으로 표현되며 개체(object) , 기록(record)이라고도 합니다. 각 요소는 요소명(element name)과 변수값(variable value)으로 구성됩니다. 예를 들어 인간을 요소로 보면 각 인간은 키와 체중이라는 이름을 가지는 속성을 가지고 있습니다. 개체의 속성을 변수로 표현합니다. 개체의 속성을 관측한 결과는 좁은 의미의 데이터이며 변수값, 관측값, 측정값, 관찰값 등으로 불리웁니다.


2.2. 척도와 속성의 대응

정형데이터는 관측대상의 속성을 관측도구로 관측하여 얻습니다. 관측도구에는 척도(scale)가 적용되어 있습니다. 척도의 종류에는 명목척도, 순서척도, 간격척도, 비례척도가 있습니다. 명목척도와 순서척도가 적용된 관측도구로는 관측대상이 개체인 경우 개체의 속성을 표현하는 범주형데이터를 얻을 수 있습니다. 범주형데이터는 개체가 가지는 속성에 따라 개체가 속하는 범주를 표현합니다. 따라서 이 경우에는 범주형데이터는 개체가 속하는 범주명을 의미합니다. 명목척도는 개체를 구분하는 범주만을 나타내지만 순서척도는 범주에 범주의 순서의 정보를 더해서 개체를 표현합니다. 간격척도는 순서를 가지는 범주에 위치의 정보를 더해줍니다. 비례척도는 위치를 가지는 범주에 양(quantity)의 정보를 더합니다. 간격척도와 비례척도는 개체의 범주형 속성을 표현할 수 있지만 개체의 연속형 속성을 표현할 때 주로 사용합니다. 척도는 기준이 필요합니다. 또한, 정형데이터를 얻으려면 관측대상인 개체의 속성과 척도의 기준의 대응이 필요합니다. 대응을 하려면 순서척도, 간격척도, 비례척도에서는 속성의 단위가 필요합니다.

척도기준에 단위적용

  명목척도 순서척도 간격척도 비례척도
관측대상인 개체의 속성 범주형 범주형 연속형 연속형
척도기준의 요구사항 범주의 독립성 순서의 방향 위치(position) 양(quantity)
척도기준 서로 다른 범주명

차순

0 :위치의 기준

0 : 양의 없음

1 : 양의 기준

예) 개체 : 개체의 속성 

딸기 : 품종

한우 : 품질

딸기 : 출하월

딸기 : 당도

예} 개체의 속성 : 척도 품종 : 설, 아키

품질 : 1등급, 2등급, … , 5등급

출하월 : 1월, 2월, … , 12월

당도 : Brix*

예) 척도기준에 단위적용

차순은 오름차순

0은 이전해 12월

0은 0Brix 

1은 1Brix 

* Brix는 용액 100g당 설탕의 무게(g)

3. 실습

3.1. 구글시트

회원의 데이터링크 계정으로 구글시트가 복사됩니다.


정형데이터 : 구글시트 실습

3.2. 함수

=ROWS(F2:F2) : 지정된 배열 또는 범위에 있는 행의 개수.


3.3. 실습강의

– 비정형 데이터 요약

– 비정형 데이터 시각화

– 정형 데이터 요약

– 정형 데이터 시각화

– 정형 데이터 활용


4. 용어

4.1 용어


데이터

데이터는 질적 또는 양적 변수값의 집합입니다. 데이터와 정보 또는 지식은 종종 같은 의미로 사용하지만 데이터를 분석하면 정보가 된다고 볼 수 있습니다. 데이터는 일반적으로 연구의 결과물로 얻어집니다. 한편, 데이터는 경제(매출, 수익, 주가 등), 정부(예 : 범죄율, 실업률, 문맹율)와  비정부기구(예 : 노숙자 인구 조사)등 다양한 분야에서도 나타납니다. 그리고 데이터를 수집 및 분석하고 시각화할 수 있습니다.

일반적인 개념의 데이터는 응용이나 처리에 적합한 형태로 표현되거나 코딩됩니다. 원시 데이터 (“정리되지 않은 데이터”)는  “정리”되기 전의 숫자 또는 문자의 모음입니다. 따라서 데이터의 오류를 제거하려면 원시 데이터에서 데이터를 수정해야 합니다. 데이터 정리는 일반적으로 단계별로 이루어지며 한 단계의 “정리 된 데이터”는 다음 단계의 “원시 데이터”가 됩니다. 현장 데이터는 자연적인  “현장”에서 수집되는 원시 데이터입니다. 실험 데이터는 관찰 및 기록을 통한 과학적 조사에서 생성되는 데이터입니다. 데이터는 디지털 경제의 새로운 자원입니다.

 

Reference

Data – Wikipedia



데이터세트

데이터세트는 데이터의 집합입니다. 일반적으로 데이터세트는 단일 데이터베이스 테이블의 내용 또는 테이블의 모든 열이 특정 변수를 나타내는 단일 통계 데이터 행렬에 해당하며 각 행은 해당 데이터 집합의 특정 구성요소에 해당합니다. 데이터세트에는 각 개체의 변수값이 나열됩니다. 각 변수값을 데이텀이라고 합니다. 데이터세트는 행의 수에 대응하는 하나 이상의 개체(member)에 대한 데이터를 포함합니다. 데이터세트라는 용어는 특정 실험이나 이벤트에 해당하는 데이터를 적용하기 위해 좀 더 광범위하게 사용될 수도 있습니다.

데이터세트 보다 덜 사용되는 이름은 데이터 자료 및 데이터 저장소입니다. 사용 예는 우주인이 우주 탐사선을 타고 실험을 수행하여 데이터세트를 수집하는 것입니다. 매우 큰 데이터세트는 일반적인 데이터 처리프로그램이 처리하기에 부적합한데 이를 빅 데이터라고 합니다. 공개 데이터 분야에서 데이터세트는 공공 데이터저장소에서 공개정보를 측정하는 단위입니다. European Open Data 포털은 50 만 개 이상의 데이터세트를 가지고 있습니다.

 

Reference

Data set – Wikipedia



4.2. 참고문헌