통계의오류공유 Report FW
- eedyi81
- 2021년 1월 10일
- 2분 분량
통계의오류공유 Report
통계의오류공유
통계의오류공유에 대하여 조사하였습니다. 통계의오류공유97
제치고 뉴욕 주지사인 Thomas Dewey가 대통령에 당선될 것이라고 예측하였으나, 선거결과는 Truman의 승리로 나타났다. 수많은 실패요인 가운데 몇가지만 살펴보면, 우선 Truman 후보가 상승세를 타고 있었음에도 불구하고, 거의 모든 조사자들이 10월초(선거는 11월)에 조사를 끝내버린 점을 들 수 있다. 둘째, 선거운동기간 동안 많은 유권자들이 유동적이었으나 투표장에 들어설 때는 Truman의 지지자가 되어 있었던 점을 들 수 있다. 그러나 무엇보다 중요한 이유는 Gallup이 사용하였던 표본이 `대표성`이 없었다는 점이다. Gallup이 이전의 선거에서 사용하여 재미를 보았던 할당표집방법이 1948년의 선거에서는 통하지 않았던 것이다. 할당표집을 하기 위해서는 유권자의 특성에 관한 정확한 자료가 필수적인 요건이다. 여론조사에서 사용하는 이같은 유권자의 특성은 대부분 센서스자료에 바탕을 두고 작성하게 되는데, 1948년의 선거조사에서 사용하였던 응답자의 특성은 1940년 센서스자료를 사용하였다. 그러나, 2차대전을 거치는 동안 미국사회는 엄청 난 변화를 겪었다. 특히, 농촌에서 도시로 인구가 급격하게 이동하는 도시화현상이 이 기간 동안 두드려졌는데, Gallup이 사용한, 미국이 2차대전에 참전하기 전인 1940년의 센서스자료에는 이같은 현상이 정확하게 반영되지 않았던 것이다. 도시거주자들 사이에서 일반적으로 민주당지지도가 높았는데도 불구하고 농촌인구가 과다계상된 표본자료를 바탕으로 조사한 결과 예측이 빗나갈 수밖에 없었다.
<사례 2> 1996년 한국의 4·11총선
1996년 우리나라의 4·11총선에서는 4개 방송기관이 5개의 전문여론조사기관에 의뢰해서 조사한 예측결과를 투표가 끝나는 시간(오후 6시정각)에 맞춰 발표하여 사람들을 놀라게 했는데, 사람들은 발표 내용에 대해 놀라고, 많은 부분이 오보였다는데서 또 한번 놀랐다.
개표가 끝나고 많은 사람들이 4·11총선 결과예측 여론조사의 문제점에 대해 지적하였는데, 대부분의 사람들이 문제의 핵심을 찾지 못하고 조사의 방법만 탓하였다. 즉, 4·11총선 선거조사에서 잘못된 예측이 많이 나온 것은 사람들이 지적하는 바와 같이 `전화조사`였기 때문이 아니고, `조사를 오후 2시에 끝냈기` 때문에 조사대상의 선정(표본선정)이 잘못되었고 그 결과 예측이 빗나갈 수밖에 없었던 것이다.
표본조사의 성패는 표본의 `대표성`에 따라 좌우된다. 그런데 방송사의 4·11총선 조사에서는 투표 마감시간인 6시보다 이른 2시에 조사를 마쳤고, 그나마 그 시간까지 집에 들어온 사람만 조사하였다. 2시에 조사를 마침으로써 아침 일찍 투표를 마치고 놀러 가거나 일을 보다 온 사람(대개 젊은 층이나 남자가 많다)과 투표를 마치고 집에서 시간을 보냈던 사람들(대개 노약자나 여자가 많다)의 특성이 다른 만큼 그들의 정치성향도 다를 수 있다는 점이 고려되지 않았던 것이다. 결과적으로, 25만명에 이르는 `거대한 표본`이 유권자를 대표할 수 있는 대표가 아니라 단순히 `많은 응답자`에 지나지 않았기 때문에, 3천여만 명이 넘는 전체 유권자의 의견을 대표할 수 있는 `표본`이 아니라 아무런 의미가 없는 `25만명의 집단`이 되고 말았다. 조사결과가 빗나간 것은 이같이 대표성이 없는 표본을 조사한 것을 전체 유권자의 의견으로 발표한 데에서 문제가 생긴 것이지, 조사수단으로 전화조사를 택했는가 면접조사나 우편조사를 택했는가 하는 조사매체의 선택과 관련된 문제가 아니었다. 개표후 많은 사람들이 `전화조사`가 빗나간 예측의 원인인 것처럼 매도하였는데 사실은 원인이 다른 데에 있었던 것이다.
[문서정보]
문서분량 : 10 Page
파일종류 : HWP 파일
자료제목 : 통계의오류공유
파일이름 : 통계의오류공유.hwp
키워드 : 통계의오류공유
자료No(pk) : 16157304
Comments