[재미있는 통계] 5. 입학시험에서 남녀차별은 신기루?
입력
수정
1973년 미국에서 실제로 벌어진 일이다.
당시 여성단체들이 버클리대 대학원 입학허가에서 남녀 차별이 있었다는 주장을 강력하게 제기했다.
이로 인해 버클리대 당국은 곤욕을 치르고 있었다.
여성단체에서는 그들의 주장을 입증할 자료로 대학원 전체의 남녀 합격률 차이를 제시했다.
남자와 여자의 합격률 차이는 표와 같았다. (도표1 참조)
대학원 전체의 남녀 합격률을 보면 남자가 52.0%이고 여자는 그보다 훨씬 낮은 42.0%였다.
이 결과를 제시하며 여성단체들은 입학허가에서 여자들이 남자에 비해 상대적으로 불이익을 받았다고 주장했다.
하지만 과연 그럴까? 대학당국은 대학원 입학시험에서 여성에 대한 차별은 결코 없었다고 강력하게 항변했다.
대학측은 그 근거로 아래의 표와 같은 대학원 6개 분야별 남녀 합격률을 제시했다. (도표2 참조)
대학원의 6개 분야별 남녀 합격률 자료를 보면 A B F 분야에서는 여자의 합격률이 남자보다 높고,C D E 분야는 남녀의 합격률이 비슷했다.분야별 자료를 보면 여성 차별 주장이 무색할 정도로 남자의 합격률이 여자보다도 낮았다.
하지만 전체적으로는 여자의 합격률이 42.0%로 남자의 52.0%보다 훨씬 낮았기 때문에 여성 차별의 논쟁이 벌어졌던 것이다.
이렇게 부분의 분석이 전체의 결과와 일치하지 않는 것을 심프슨의 역설(Simpson's paradox)이라고 한다.
위의 사례는 심프슨 역설의 전형적인 예로 많이 거론된다.
이런 결과가 나온 이유는 무엇일까.
원인은 분야별 지원자 수의 차이에 있었다.
합격률이 60% 이상으로 높은 A B 분야에서 남자 지원자 수는 1385명이었던 반면 여자 지원자 수는 133명에 불과했다.
합격률이 높은 분야에 남자 지원자들이 훨씬 많았던 것이다.
반대로 여자들은 합격률이 30% 내외에 불과한 C D E 분야에 많이 몰렸다.
이 때문에 전체적으로 볼 때는 여자의 합격률이 낮게 나타난 것이다.
심프슨의 역설은 동일하지 않은 가중치를 적용함에 따라 부분에 대한 분석 결과와 전체에 대한 분석 결과가 일치하지 않는 현상을 말한다.
이는 가중평균으로도 설명할 수 있다.
예를 들면 남자의 전체 합격률은 각 분야별 합격률에 지원자 수를 고려한 가중치(분야별 남자 지원자÷전체 지원자 수)를 곱한 가중평균으로 구한다.
여자의 전체 합격률도 이 같은 방식으로 구할 수 있다.
이때 분야별 지원자의 크기가 다르면 서로 다른 가중치를 적용하기 때문에 부분의 합격률과 전체의 합격률이 일치하지 않는 현상이 생기는 것이다.
김진호 교수 jhkim@kndu.ac.kr
[ 약력 ]
△서울대 경영대 졸업
△미국 펜실베이니아대 와튼스쿨 경영학 석·박사
△(전)KBS 선거예측조사 자문위원
△(현)국방대 경영학과 교수
당시 여성단체들이 버클리대 대학원 입학허가에서 남녀 차별이 있었다는 주장을 강력하게 제기했다.
이로 인해 버클리대 당국은 곤욕을 치르고 있었다.
여성단체에서는 그들의 주장을 입증할 자료로 대학원 전체의 남녀 합격률 차이를 제시했다.
남자와 여자의 합격률 차이는 표와 같았다. (도표1 참조)
대학원 전체의 남녀 합격률을 보면 남자가 52.0%이고 여자는 그보다 훨씬 낮은 42.0%였다.
이 결과를 제시하며 여성단체들은 입학허가에서 여자들이 남자에 비해 상대적으로 불이익을 받았다고 주장했다.
하지만 과연 그럴까? 대학당국은 대학원 입학시험에서 여성에 대한 차별은 결코 없었다고 강력하게 항변했다.
대학측은 그 근거로 아래의 표와 같은 대학원 6개 분야별 남녀 합격률을 제시했다. (도표2 참조)
대학원의 6개 분야별 남녀 합격률 자료를 보면 A B F 분야에서는 여자의 합격률이 남자보다 높고,C D E 분야는 남녀의 합격률이 비슷했다.분야별 자료를 보면 여성 차별 주장이 무색할 정도로 남자의 합격률이 여자보다도 낮았다.
하지만 전체적으로는 여자의 합격률이 42.0%로 남자의 52.0%보다 훨씬 낮았기 때문에 여성 차별의 논쟁이 벌어졌던 것이다.
이렇게 부분의 분석이 전체의 결과와 일치하지 않는 것을 심프슨의 역설(Simpson's paradox)이라고 한다.
위의 사례는 심프슨 역설의 전형적인 예로 많이 거론된다.
이런 결과가 나온 이유는 무엇일까.
원인은 분야별 지원자 수의 차이에 있었다.
합격률이 60% 이상으로 높은 A B 분야에서 남자 지원자 수는 1385명이었던 반면 여자 지원자 수는 133명에 불과했다.
합격률이 높은 분야에 남자 지원자들이 훨씬 많았던 것이다.
반대로 여자들은 합격률이 30% 내외에 불과한 C D E 분야에 많이 몰렸다.
이 때문에 전체적으로 볼 때는 여자의 합격률이 낮게 나타난 것이다.
심프슨의 역설은 동일하지 않은 가중치를 적용함에 따라 부분에 대한 분석 결과와 전체에 대한 분석 결과가 일치하지 않는 현상을 말한다.
이는 가중평균으로도 설명할 수 있다.
예를 들면 남자의 전체 합격률은 각 분야별 합격률에 지원자 수를 고려한 가중치(분야별 남자 지원자÷전체 지원자 수)를 곱한 가중평균으로 구한다.
여자의 전체 합격률도 이 같은 방식으로 구할 수 있다.
이때 분야별 지원자의 크기가 다르면 서로 다른 가중치를 적용하기 때문에 부분의 합격률과 전체의 합격률이 일치하지 않는 현상이 생기는 것이다.
김진호 교수 jhkim@kndu.ac.kr
[ 약력 ]
△서울대 경영대 졸업
△미국 펜실베이니아대 와튼스쿨 경영학 석·박사
△(전)KBS 선거예측조사 자문위원
△(현)국방대 경영학과 교수