AI(인공지능)는 어떻게 예측을 하나

최소제곱법을 이용한 회귀선 그리기


두 변수간 관계를 나타내는 회귀선의 수식을 알아내서 예측합니다.

회귀선은 최소제곱법(Method of Least Squares, MLE)을 이용해서 구합니다. 최소제곱법을 최소자승법, 최소제곱근사법, 최소자승근사법 등으로 부르기도 합니다.

산점도 위에서 두 변수의 평균이 만나는 점을 먼저 찾고, 이를 지나가는 직선 중에서 잔차제곱의 합이 가장 작은 직선이 회귀선이 됩니다.

 

잔차란 직선과 Y값의 차이인데, 이를 회귀선의 오차 혹은 잔차라고 부릅니다.

 

종속변수인 당도를 Y, 독립변수인 과중을 X라고 할 때, 회귀선은 X와 Y의 방정식으로 표현할 수 있습니다.

애니메이션으로 표현한 딸기 20개의 당도와 과중은 다음의 식으로 표현할 수 있습니다.

Y=0.52*X-0.42 

 

잔차 혹은 오차란, 우리가 20개의 딸기 데이터를 모델링해서 만든 위의 식으로 부터 얻은, 특정 과중에서의 당도 예측값과 실제 당도의 차이입니다.

 

회귀선이란, 두 변수가 선형관계를 이룬다고 할 때, 이 점들을  대표하는 방식입니다.

회귀선이 구해지면 딸기의 과중만 측정하면 당도를 측정하지 않고도 예측할 수 있습니다.

 

관계가 있는 변수를 정의하고, 이 변수들 간 회귀선을 구하는 것이 인공지능을 모델링하는 가장 중요한 기본이라고 할 수 있습니다.