Article

社会学:代表性を欠く大規模調査によって大幅に過大評価された米国のワクチン接種率

Nature 600, 7890 doi: 10.1038/s41586-021-04198-4

調査は大衆の意見や行動を理解するための極めて重要な手段であり、その正確さは、あらゆる原因による偏りを最小化することによって対象集団の統計的代表性を確保することに懸かっている。データサイズを増大させると、信頼区間が狭まるが調査の偏りの影響は大きくなり、これは「ビッグデータのパラドックス」の一例である。今回我々は、デルファイ–フェイスブック(Delphi–Facebook;回答数は1週当たり約25万件)と米国国勢調査局による世帯パルス調査(Census Household Pulse;同2週当たり約7万5000件)という2つの大規模調査から得られた、2021年1月9日~5月19日の米国成人の新型コロナウイルス感染症(COVID-19)のワクチン初回接種率の推定値において、このパラドックスを実証する。2021年5月には、米国疾病管理予防センターが2021年5月26日に発表した遡及的に更新された基準との比較で、デルファイ–フェイスブックは17ポイント(基準の不正確性が5%で14~20ポイント)、世帯パルス調査は14ポイント(同11~17ポイント)、それぞれ接種率を過大評価していた。さらに、それらのサンプルサイズが大きかったことで、不正確な推定値の誤差範囲が極めて小さかった。対照的に、調査研究のベストプラクティスに従って実施されたアクシオス–イプソス(Axios–Ipsos)のオンラインパネル(回答数は1回につき約1000件)では、得られた推定値と不確実性の定量化の信頼性が高かった。我々は、最近開発された分析の枠組みを用いて、観測された誤差を分解し、これら3つの調査における不正確性を説明した。さらに、ワクチン忌避および接種意欲に関する影響も分析した。その結果、回答者数25万人の調査で得られた集団平均の推定値が、サンプルサイズが10の単純無作為抽出で得られた推定値と比べて、正確さに変わりがないことが明らかになった。我々の結果は、データは量よりも質が重要であり、質を量で補うことは、数学的に証明可能な勝ち目のない提案だということを強調している。

目次へ戻る

プライバシーマーク制度