김진호 < 국방대학원 교수 gemkim@unitel.co.kr >

통계적으로 상관관계는 어떤 변수가 증가할 때 다른 변수가 함께 증가하는가
혹은 감소하는가를 관찰하여 파악한다.

그러나 어떤 상관관계는 그냥 우연의 일치인 경우도 많다.

아무렇게나 고른 두 변수를 조사했을 때 두 변수가 전혀 관계가 없는
경우보다 그냥 우연히 두 변수가 상관관계를 보이는 경우가 흔하다는 말이다.

이런 사실이 믿어지지 않으면 다음의 변수들을 년도별로 조사해서 상관관계
를 구해 보아라.

담배소비량, 피부암 환자수, 청소원의 월급, 단층촬영기계의 수, 의치
생산량, 대학생 총수 등.

놀랍게도 이들 변수간에는 대부분 상관관계가 존재할 것이다.

그리고 이러한 상관관계는 대부분 그냥 우연에 의해서 얻어지는 상관일
뿐이다.

그러나 문제는 이런 우연적인 상관관계를 어떤 인과관계가 있는 것처럼
해석을 할 때 생기는 것이다.

미니 스커트의 길이와 경기상황과도 상관관계가 있다고 한다.

그래서 이를 이용해서 미니스커트 길이로 그 해의 경기를 예측하는 경우도
있다.

즉 미니스커트의 길이가 무릎위로 올라갈수록 경기가 좋아지고, 반대로
무릎 아래로 내려갈수록 경기가 나빠질 것이라고 예측한다.

더욱이 여기에다 그럴듯한 분석까지 덧붙인다.

치마길이는(혹은 노출의 정도는) 여자들의 낙관적인 혹은 비관적인 전망의
상대적인 정도를 나타낸다고 억측한다.

그런데 소비의 대부분은 여자들에 의해서 결정되므로 여성들의 전망에 따라
경기의 방향이 결정된다는 것이다.

실제로 스커트의 길이와 경기지수사이에 상관관계가 있더라도 그것은 그냥
우연히 관계가 있는 것일 뿐이다.

뉴스거리를 찾는 언론에게 상관관계는 우선 흥미 있는 기사거리가 된다.

태양의 흑점활동과 테러리스트의 활동과 관계가 있다든지, 학교에서의
성적과 사회에서의 성공이 음의 상관이 있다든지, 흡연이 성생활과 관련이
있다든지 하는 것은 독자들의 눈길을 끌 수 있을 것이다.

그러나 대부분의 이런 기사는 그저 흥밋거리로 읽는 것으로 족하다.

우연한 상관은 너무나 흔하기 때문이다.

( 한 국 경 제 신 문 1999년 4월 9일자 ).