[재미있는 수학] 정확한 예측 위해서는 표본 선정을 잘 해야
입력
수정
지면S12
(13) 여론 조사와 통계2024년 4월 10일, 제22대 국회의원 선거가 실시됩니다. 선거일 현재 18세 이상의 국민이 선거권을 지닌 만큼 고등학생 중 일부 학생은 이번에 첫 투표를 하게 될 것입니다. 선거일이 다가올수록 TV나 신문 등 언론매체에서 각종 여론조사 결과를 발표하고 있습니다. 이 여론조사 결과를 보면 사회집단 구성원 속 여론의 동향을 알아볼 수 있기 때문에 정치인이나 유권자가 서로를 이해하는 데 도움을 줍니다. 그런데 여론조사에서는 전체 구성원의 의견을 묻는 것이 아닌 일부만 뽑아서 표본조사를 합니다. 이에 대해 한번 알아봅시다.
여론 조사는 조사 대상자를 어떻게 선정하는지에 따라 그 결과가 달라집니다. 여론 조사 결과를 보고 모집단의 특성이 잘 반영된 표본이 선정되었는지 확인하면서 통계를 비판적으로 해석하는 태도를 기릅시다.
통계조사에서 조사 대상이 되는 집단 전체를 조사하는 것을 ‘전수조사’라고 합니다. 그런데 전수조사는 많은 시간과 비용이 필요할 뿐 아니라 전수조사 자체가 불가능한 경우도 있습니다. 이 때문에 조사 대상이 되는 집단 전체에서 일부분만 뽑아 조사하는 표본조사를 실시합니다.표본조사에서 조사 대상이 되는 집단 전체를 ‘모집단’이라 하고, 모집단에서 뽑은 일부분을 ‘표본’이라고 합니다. 또 모집단에서 표본을 뽑는 것을 ‘추출’이라고 합니다.
표본조사의 목적은 표본에서 얻은 정보를 바탕으로 모집단의 특성을 추측하는 데 있습니다. 따라서 모집단의 특성이 잘 반영되도록 표본을 택하는 것이 중요합니다. 이를 위해서는 추출되는 표본이 모집단의 어느 한 부분에 편중되지 않아야 한다. 표본추출이 잘못된 한 가지 사례를 소개합니다.미국에서는 오래전부터 선거 여론조사를 통해 선거 결과를 예측해 보도했습니다. 미국의 대중 잡지 <리터러리 다이제스트>는 전화번호부와 자동차 등록부를 이용해 선정된 조사 응답자를 대상으로 우편엽서를 통한 여론조사를 실시해 1920년부터 1932년까지 있었던 네 차례 미국 대통령선거 결과를 정확히 예측했습니다.
그런데 1936년 대통령선거에서 공화당의 랜던 후보와 민주당의 루스벨트 후보의 선거 결과를 잘못 예측해 순식간에 몰락하게 됩니다. 이 잡지는 당시에도 1000만 명의 유권자에게 설문지를 발송했고, 회수된 230만 장을 집계해 공화당 랜던 후보의 압도적 승리를 예측하면서 대대적으로 보도했습니다. 그러나 결과는 민주당 루스벨트 후보의 압승이었습니다. 예측이 빗나간 원인은 표본이 전화 가입자와 자동차 소유자인 것에 있었습니다. 당시는 미국 역사상 최악의 경제불황 말기였는데, 지나칠 정도로 부유한 사람들을 표본으로 선정한 것입니다. 표본은 빈민층을 전혀 포함하지 못했고, 많은 수의 빈민층은 루스벨트 후보의 뉴딜 경기 회복 프로그램을 지지했기 때문에 예측이 틀릴 수밖에 없었던 것이지요.
반면 같은 선거에서 ‘조지 갤럽’은 불과 5000명을 조사하고도 루스벨트 후보가 랜던 후보를 이길 것이라고 예측했는데, 그 이유는 ‘할당표본 추출’을 이용해 모집단 특성에 따라 표본을 선정했기 때문입니다. 갤럽은 전국에서 각 소득계층의 인원수를 파악해 응답자가 각 계층 내 정확한 비율을 나타내도록 표본을 선정했습니다. 갤럽은 이 방법으로 선거 여론조사를 함으로써 이후의 대통령선거에서도 당선자를 정확하게 예측할 수 있었습니다.이처럼 여론조사는 조사 대상자를 어떻게 선정하느냐에 따라 결과가 달라집니다. 보다 정확한 예측을 위해서는 모집단의 특성을 잘 반영할 수 있도록 표본을 선정해야 합니다.
자, 위의 내용을 읽고 추가로 궁금한 점이 많을 것이라고 생각합니다. 우리가 학교에서 직접 설문조사를 실시할 때 표본을 어떻게 선정해야 모집단의 특성을 잘 반영할 수 있을까요? 여론조사에서 일부 의견이 전체 의견을 대표하는 것이 가능한 것인가요? 발표되는 여론조사에서는 출처를 꼭 밝히는데, 왜 그럴까요? 여론조사에서 오차범위라는 것은 무슨 뜻일까요?
이러한 질문에 대해서는 여러분이 좀 더 고민해 보고 답을 찾아보세요. 이 내용에 대해 더 자세하게 공부하고 싶다면 ‘확률과통계’ 과목의 ‘통계’ 단원을 살펴보면 도움이 됩니다.각종 매체에서 다양한 방식으로 통계를 소개하고 있습니다. 평소 통계에 관심을 많이 가지고, 통계를 있는 그대로가 아닌 비판적으로 해석해보기 바랍니다.