통계이야기 1
  통계이야기 2
  통계이야기 3
  통계이야기 4
  통계이야기 5
 
[회귀분석] 다항식도 선형 함수
다항식도 선형 함수


흔히들 선형함수(linear function)라 하면 아마 머리에는 중,고등학교에서 배운
직선 함수, y=a*x+b, 나 평면 함수, y=a*x1+b*x2+c, 등을 생각할 것입니다.



크게 틀리지 않습니다. 그러나 수학에서 선형 함수는 좀 더 엄밀하게 정의 되어 있습니다.
함수가 다음과 조건을 만족시키면 선형 함수라 합니다.







이 함수의 특징은 항상 원점을 통과하다는 것입니다. 그래서 흔히 생각하는 직선은 선형 함수가 아니고
원점을 지나는 직선만 선형함수 입니다. 주의해야 할 점은 a1,a2는 그냥 상수이고 x1,X2가 변수라는 점입니다.



우리가 자주 쓰는 기대값,적분,미분 다 선형 함수의 일종입니다. 이런 경우 함수라는 말은 잘 안쓰고 흔히들
operator라고 표현을 잘 씁니다.



그럼 회귀분석 모형을 한번 볼까요?







여기서 X1~Xk까지의 함수로 보면 분명히 선형 함수가 아닙니다. 상수항이 있기 때문이지요. 그래서
회귀분석 모형을 선형 모형이라 하면 이때 변수는 입니다. X들은 그냥 숫자에 불과합니다.



그럼 을 변수로 보아 선형 함수로 정의 하면 어떤 장점이 있을까요?



다양한 비선형 모양의 함수들이 선형으로 정의되고 그 경우 일관된 이론을 적용 시킬 수 있습니다.
예를 들어 β을 추정한다든지, F 검증을 하다든지 이런 이론들이 선형 모형이라는 한 틀안에서 동일하게 적용
시킬 수 있습니다.



대표적인 예를 들어 볼까요.


회귀선(반응식)이 다항식인 경우를 봅시다.







여기서 아래와 같이 약간의 변형을 하면







위의 k차 다항식은 보통 선형 모형으로 바뀝니다. 앞서 언급했지만 설명 변수 X들은 데이터에서 얻은 단순한 숫자에
불과합니다. 따라서 X의 제곱이나 세 제곱이나 전부 다 숫자입니다. 오로지 변수는 β 입니다. 따라서 β에
관한 선형 모형입니다.



또 다른 예를 보면, 반응식이 조금 복잡한







경우입니다. 이 경우도 양쪽에 log을 취하면







가 되고 여기서 logY -> Y로 바꾸면 다시 선형 모형으로 바뀝니다.



이런 다양한 비선형 반응식을 선형식으로 바꿔 놓으면, 선형식으로 전개한 이론을 일괄적으로
그대로 적용시킬 수 있는 장점이 있습니다.(물론 이런 식으로 선형 모형을 정의하는데 반대의 의견도 있습니다.)