본문 바로가기
풀어쓰는 강의노트

표본은 전체를 대변한다?

by ibislab 2008. 11. 3.

- 표본은 전체를 대변한다?? - 

 통계 조사에는 조사 대상 전부를 하나하나 다 조사하는 경우도 있고 전체중 일부만 뽑아서 조사하는 경우도 있습니다. 전자를‘전수조사’라고 하고, 후자를 표본조사라고 합니다. 전수조사로서 대표적인 조사는 5년마다 하는 인구주택총조사가  있습니다. 그러나 대부분의 통계조사는 표본조사에 해당합니다. 그럼 표본조사에 사용되는 표본은 무엇 일까요?

 우리는 찌개의 간을 볼 때 국자로 국물을 조금 떠서 먹어봅니다. 이때 국자로 떠올린 국물이 찌개의 간이 적당한지를 판단하기 위한 표본이 되는 것입니다. 그런데 찌개 속의 소금이 골고루 다 풀어지지 않아서 어떤 부분은 짜고 어떤 부분은 싱거울 수도 있지요. 이때 공교롭게도 싱거운 부분만 떠서 먹어보았다면? 제대로 간을 봤다고 할 수 없을 것입니다.
 

 통계조사도 마찬가지입니다. 표본을 잘못 뽑으면 엉뚱한 결과가 나올 수도 있습니다. 특히 사람을 표본으로 뽑을 경우 잘못 추출하는 일이 종종 있습니다. 1936년 미국의 대통령 선거가 그 대표적인 예인데요.

 당시 선거는 공화당의 랜던 후보와 민주당의 루스벨트 후보간 대결 구도였습니다. 한 잡지사에서 여론 조사를 위해 무려 1,000만 명의 유권자에게 설문지를 보내 그 중 230만 명에게 응답을 받았습니다. 잡지사는 이를 분석하여 랜던 후보가 큰 표차로 승리할 것이라고 예측 보도를 했지요. 그러나 결과는 민주당의 루스벨트 후보가 압도적인 지지로 대통령에 당선되었습니다.

 무려 200만 명이나 되는 사람을 조사했는데 왜 이런 일이 벌어진 것일까요? 바로 표본에 문제가 있었기 때문입니다.

 이 잡지사가 설문지를 보낸 1,000만 명은 잡지의 정기 구독자와 전화번호부를 근거로 선정된 사람들이었습니다. 그런데 당시 미국에서 잡지를 정기적으로 구독하거나 전화기를 갖고 있는 사람은 소득이 높은 계층에 속한 사람들이었죠. 그 해 선거에서 소득이 낮은 계층은 민주당을, 높은 계층은 공화당을 특히 선호하는 현상이 심했는데 잡지사가 뽑은 표본 속에는 루스벨트 후보를 지지하는 사람이 상대적으로 적을 수밖에 없었던 것입니다.

 이 사례는 선거 여론조사의 역사에서 가장 유명한 실수로 기록되고 있습니다. 대표성이 없는 표본은 크기가 아무리 크더라도 전체의 특성을 올바르게 알려줄 수 없다는 교훈얻은 것이지요.

                                                            출처: 통계청홈페이지 통계로보는세상