상관계수의 성질

상관계수 r=defSXYSXXSYY 은 다음과 같은 성질을 가진다.

  1. 1r1
  2. |r|의 값이 1에 가까울수록 산점도의 점들은 적합선에 가깝게, 즉 SSE가 0에 가깝게 되며 |r|=1SSE=0모든 점들이 적합선 상에 위치함 이다.
  3. r=0Cov(X,Y)=0의 필요충분조건이다.
  4. r의 부호는 적합선의 기울기의 부호와 일치한다.

위의 사실들의 증명은 코시-슈바르츠 부등식 uv|uv|, and equality holds iff k(u=kv or v=ku) 를 사용하면 쉽게 증명된다.

(코시-슈바르츠 부등식의 증명): [펼치기]

이 부등식은 일반적인 복소벡터공간에 대해서도 성립하지만 여기서는 u,vRn인 경우에 대해서만 증명하기로 한다.

v=0인 경우에는 등식이 항상 성립하므로 더 이상 논의할 것이 별로 없다. v0를 가정하자.

u=(u1,,un), v=(v1,,vn)로 놓고 (1)(u12++un2)(v12++vn2)(u1v1+unvn)2 을 보여야 한다. 모든 실수 t에 대하여 다음의 부등식이 성립함에 주목한다. (2)(u1v1t)2++(unvnt)20 t에 대한 2차식으로 정리하면 (3)v2t22(uv)t+u20 모든 t에 대하여 위의 부등식이 성립한다는 것은 (2차항의 계수가 0이 아니므로) 판별식이 0 이하라는 것을 함의한다. 즉, (uv)2u2v20 이 성립하며 이것이 바로 우리가 보이려던 부등식 (1)이다.

이제 등호 관련 명제를 증명하기 위하여 u2v2=(uv)2을 가정하자. 그러면 판별식이 0이며 따라서 (3)의 좌변의 값, 즉 (2)의 좌변의 값이 0이 되는 t=defk가 존재한다. 제곱들의 합이 0이라는 것은 모든 (uivit)2이 각각 0이라는 것을 의미하므로 u1=kv1,,un=kvn이 성립한다. 즉 u=kv이다.

역방향의 증명은 아주 쉽다.

(1)의 증명:

r21, 즉 (i(xix¯)i(yiy¯))2i(xix¯)2i(yiy¯)2을 보이면 된다.

이 부등식은 ui=xix¯, vi=yiy¯로 두고 코시-슈바르츠 부등식을 적용하면 바로 얻어진다.

(2)의 증명:

SSE=i(yiabxi)2이므로 SSE=0는 모든 점들이 yi=a+bxi를 만족할 때, 즉 적합선 상에 있을 때, 그리고 이때만 성립한다.

|r|=1은 코시-슈바르츠 부등식에서 등호가 성립함을 의미하며 이는 u=kv 또는 v=kukR이 존재함을 의미한다.

만일 모든 i에 대해서 yi=a+bxi라면 (a=y¯bx¯이므로) yi=(y¯bx¯)+bxi이고 이는 yiy¯=b(xix¯), 즉 u=bv를 함의한다. 따라서 |r|=1이다. 역방향의 증명은 비슷한 방법으로 쉽게 이루어지므로 생략한다.

|r|의 값이 1에 가까울수록 SSE는 0에 가깝다는 사실은 [정리 7.7]과 [정리 7.8]에 의하여 얻어지는 r2=1SSESST로부터 알 수 있다.

(3)의 증명:

r=0SXY=0Cov(X,Y)=0

(4)의 증명:

r의 부호는 정의에 의하여 SXY의 부호와 일치한다. 적합선의 기울기는 b=SXY/SXX로 계산되므로 역시 부호가 SXY와 일치한다.

[홈으로]