Feature

因果関係を見つけ出すツール

Credit: ILLUSTRATION BY ACAPULCO STUDIO

1812年、英国の眼科医James Wareは、興味深い知見をロンドン王立協会の会員らに披露した。英国陸軍連隊に志願した若い男性数千人のうち、視力が低くて入隊できなかったのは20年でわずか6人だけだった。ところが、同じくらいの年齢でオックスフォード大学に入学予定の学生の場合、拡大鏡や眼鏡に頼る者が全体の4分の1にも達した1

Wareはその因果関係について、例えば本を丹念に読むことが視力を低下させるのではないかとか、眼鏡を掛けた人は自然と学問に魅力を感じるのだといった結論を、何も引き出さなかった。そして、結論を導き出さなかったのは正解だった。疫学者らは長年、環境曝露と健康を結び付ける観察結果に悩まされてきた。近視はその典型的な例の1つだ。学校で過ごす時間が最も長い子どもは視力が最も低いことが、数十年に及ぶ複数の研究で明らかになっている。しかし、このデータからは、就学によって子どもが近視になるのか、それとも近視の子どもがより長い期間就学するのかは分からない。あるいは、社会経済的な状況など何か他の要因が、就学年数と近視の両方を促進させているのかどうかも分からない。

この論理上の袋小路にうんざりした一部の疫学者は、20世紀の終わりまでに疫学という分野を終わりにすべきだと考え始めた。遺伝学の進歩でもっとよく説明できるようになる、というのが彼らの言い分だった。

彼らは半分正しかった。それから20年経ち、遺伝学によって、相関関係と因果関係の絡まりを解きほぐす方法は大きく変わったのだ。ところが、疫学はこれで葬り去られるのではなく蘇ることになった。遺伝的差異を環境曝露の代理として使えば、解析から交絡変数を排除するのに役立つことが明らかになったのだ。これがメンデル無作為化(Mendelian randomization)と呼ばれる手法である。

すでに研究者らはこの手法を使って、観察データを再評価したり、因果関係に関する長年の疑問に対して新しくより堅固な結論を引き出したりしている。そうした解析研究で、低コレステロール値はがんの原因にはならないこと2や、少量の飲酒と心臓の保護効果には因果関係がないこと3、また、就学で子どもが近眼になる可能性があること4などが確認された。

「原理としてのメンデル無作為化は、本当に素晴らしいアイデアです。これは、疫学で最も手強い難題の1つを解こうとするものです」と、アムステルダム自由大学(オランダ)の社会科学遺伝学者Philipp Koellingerは話す。

躍進を遂げる

メンデル無作為化の開発に協力したブリストル大学(英国)の臨床疫学者George Davey Smithは、「これが実現したのは、疫学においてより良い因果推論を得る方法を我々が必死になって探していたからです」と話す。ただし、マイナス面もあると彼は言う。「問題は、すごく簡単に実行できるようになったことです」。

彼はこれまで同僚らに、メンデル無作為化に入れ込み過ぎないよう呼び掛けてきた。これは強力なツールだが、適切に使う必要がある。遺伝学データが積み重なるにつれて、水準に達しないメンデル無作為化解析が次々と報告されている。誤解を招くデータに頼った解析もあれば、メンデル無作為化がよりどころとする仮定を十分に検証していない解析もあったのだ。今こそ気持ちを引き締めるべき時だと、疫学データ解析に関わる研究者の多くが口にする。

疫学が自然消滅に向かっていると考えた研究者の1人、Davey Smithは、International Journal of Epidemiology の論説で共著者と共に、環境曝露で生じ得る害もしくは恩恵に関する観察データにおいて、介入を無作為化比較試験で検証する場合、失敗を繰り返すだろうと指摘した5

この論説が掲載された数年後、1億ドル(約110億円)規模の臨床試験「SELECT」の派手な失敗で、彼らの指摘が強くはっきりとした形で現実となった。セレンのサプリメント摂取が前立腺がんを防ぐことを示唆する疫学的証拠が多数集まっていたにもかかわらず、SELECTでセレンにそうした予防効果はないことが明らかになったのだ6

「その結果は予想以上に落ち込むものでした。そして、疫学に対する世評は厳しくなっていきました」とDavey Smithは話す。研究者らは1986年という早い段階ですでに、遺伝学が疫学データの解釈を改善してくれると考えていた7。しかし、そうした取り組みに弾みがつくには、遺伝的バリアント(集団内にある程度の頻度で存在する遺伝的変異)を特定の形質と関連付けるゲノムワイド関連解析(GWAS)が成長する必要があった。2018年、Davey Smithはメンデル無作為化解析を頼りに、セレンと前立腺がんの関係を再検討した。

Davey Smithのチームは数万人の男性の遺伝子型データを用い、血中セレン値が先天的に高い事例と関連する遺伝的バリアントを10個余り見つけた8。これらを持つ人々は、出生時からセレンのサプリメントを摂取し続けてきたようなものだ。次に研究チームは、これらのバリアントを持つ人々の前立腺がん発生率を、持たない対照群の発生率と比較した。そうすることで、より直接的にセレン値に注目でき、セレン値とがんリスクの両方に影響を及ぼす可能性のある生活要因(健康食など)の影響を排除することができる。また、セレン値の高低の傾向はDNAに書き込まれているので、初期の前立腺がんがセレン値に影響を及ぼす「逆の因果関係」の可能性は、解析上さほど問題にならなかった。

この解析でも、SELECT臨床試験の場合6と全く同様に、セレンの有効性は見いだされなかった8

データの恩恵

こうした解析結果が、本格的な臨床試験を開始すべきかどうかの判断に絡んでくる場合もあるとDavey Smithは述べている。また、試験するのが非倫理的もしくは実現困難だと思われる仮説を、メンデル無作為化で検証できる場合もある。

原理的には、ある遺伝的バリアントが環境曝露の影響を先天的に模倣することを明らかにできれば、メンデル無作為化解析を行うことは可能だ。また、そうしたバリアントは年々増えているが、これは特に、世界で数百万人がゲノム解析や健康状態の追跡の被験者として参加しているためである。これにより遺伝学者らは、飲酒からコレステロール値まで、あらゆる事例の遺伝学的な相関関係を特定するための統計的検出力を手に入れたわけである。

現在、疫学者や他の研究者らは、これらの知見をさらに多くのメンデル無作為化試験に組み込もうとしている。引用文献データベースである「Scopus」や「Web of Science」からのデータによると、この話題に関する論文の本数は、2010年には年間100本未満だったが、2015年には約200本まで増えた。2019年末までのところ、メンデル無作為化を使ったり論じたりした研究の論文は500本を超える。研究者らはこの試験法を使い、通常は生物の多くの変数に交絡されるさまざまな疑問に取り組んできた。研究は、飲酒ががんリスクを高める可能性があることをより明確に示すのに役立った9。一方、低コレステロール値の方はがんリスクを高める可能性がなく2、一部の観察結果とは反対の結果になった(「遺伝子を代理として使う」参照)。

遺伝子を代理として使う
メンデル無作為化では遺伝子バリアントを使って疫学データ内の因果関係を調べる。例えば、一部のデータが示唆するように、コレステロール値が低いとがんリスクが上昇するかどうかを、遺伝学的に低コレステロール値の素因がある人々を調べることで検討できる。このやり方は、「逆の因果関係」(この場合「がんがコレステロール値を下げる」という関係)を排除するのに役立ち、また、がんリスクとコレステロール値の両方に影響する可能性のある一部の変数も無視できる。しかし、このやり方はいくつかの仮定の上に成り立つものであり、それらの仮定は検証する必要がある。
仮定1:バリアントと低コレステロール値の関連性は、時間が経過しても強固で安定していなければならない。
仮定2:バリアントは、コレステロール値とがんリスクの両方に影響を及ぼす可能性のある変数に影響してはいけない。
仮定3:バリアントは、コレステロールとの関係以外のいかなる経路でもがんリスクと関連してはならない。

メンデル無作為化がどう役に立つかを示す主な例の1つとして、多くの研究者が近視を挙げる。近視は、急速に拡大する公衆衛生問題の1つだ。近視と就学年数の関係を、無作為化比較試験で調べることは不可能である。意図的に一部の児童が学校教育を受けないようにすることは倫理に反するからだ。

メンデル無作為化を使う機会は2016年に訪れた。遺伝学者らが2件のGWASのデータを発表したのである。一方は、就学年数と関連する遺伝学的シグネチャーを探したもの10、もう一方は、近視と関連する遺伝子を探したものだ11。これらの研究では、数十万人を対象にして、近視および就学年数と確実に関連する遺伝的バリアントが数十個見つかった。

2017年、疫学者らがこれらのバリアントを使って、最大規模の集団データの1つを探索した。これは、英国バイオバンク計画に登録した48万8000人の中高年集団だ。被験者は自身のゲノムを解析され、就学年数や視力など個人の詳細情報に関する数十項目の質問に回答する。英国のカーディフ大学とブリストル大学の研究者らが、このデータをメンデル無作為化で解析したところ、遺伝学的な観点から見て近視になりやすい傾向は就学年数に影響しないことが分かった。しかし、就学年数と関連する遺伝子を持つ人々は、近視になる傾向が有意に強かった4

読書に費やす時間、あるいは自然光の弱さ、もしくは何か他の要因のいずれによるものであろうと、就学年数は明らかに視力に影響を与えていると、このプロジェクトを率いたブリストル大学の眼科医Denize Atanは話す。彼女によれば、この相関性は非常に強いので、政策立案者や学校はこの問題にもっと取り組むべきだという。

公然の秘密

批判派によれば、問題は、全てのメンデル無作為化解析が完璧なわけではないことだという。「解析は、確固とした仮説といくつかの裏付けを得てから始める必要があります」とAtanは言い、そうでないものがますます増えていると話す。「『彼らはそのアイデアをいったいどこから得たのだろうか?』と思うことでしょう。まるでアイデアが突然舞い降りたかのようですから」。これは大きな問題だと彼女は話す。なぜなら、メンデル無作為化を使えば、関係領域の専門知識がなくても、よく知らないデータセットの間の関係性を探って見つけ出し、論文として発表してしまえるからだ。

エラスムス大学医療センター(オランダ・ロッテルダム)の疫学者Sonja Swansonは、「ボタンを押して『私の疑問に対する数値的な答えはここにあります』と言うだけの簡単なお仕事なんです」と手厳しい。

何人かの疫学者によれば、発表済みのメンデル無作為化解析の多くに問題があることは、この研究領域では公然の秘密だという。「論文を非常に簡単に掲載してもらえるのです。ひどい論文の中には、疫学の原理を理解していない研究者からのものもあります」とDavey Smithも嘆く。2016年のある論文では、メンデル無作為化解析の結果、炎症に関連する肝臓酵素「C反応性タンパク質」の血中値が高いと統合失調症になることを見つけた、という主張がなされた。これは、C反応性タンパク質の血中値を低下させる薬剤が統合失調症患者の治療に役立つ可能性があることを示唆していた12。Davey Smithのチームともう1つのチームが同様の解析を行ったところ、実際はC反応性タンパク質に統合失調症を防ぐ作用があることが分かった13。Davey Smithと共著者らは、最初の研究グループによる遺伝データセットの組み合わせ方に問題があったことを示唆し、2016年のその論文は最終的に撤回された。

疫学者らに批判されている研究は他にもある14。妊娠中の喫煙によって、子どもの出生時体重が大幅に低くなることを見いだしたとするメンデル無作為化解析結果15や、子どもの口腔顔面裂のリスクが明らかに上昇するとしたメンデル無作為化解析結果16もそうだ。

問題は、喫煙行動の代理として用いられた遺伝的バリアントが、候補遺伝子を探す研究で見つかったものだという点だ。それらの研究では、喫煙などの行動に関与していると研究者らが推測した少数の遺伝子を評価している。こうして得られる結果は、調べた遺伝子に何らかの作用を見いだそうとする方向にバイアスがかかるため、信頼できない可能性がある。これらのメンデル無作為化解析で論文著者らが使ったバリアントは、もっと大規模でより包括的なGWASではまだ見つかっていない。

喫煙に関する一連の研究を率いたアイオワ大学(米国アイオワシティー)の保健政策研究者George Wehbyは、この研究の後にもっと良いデータが入手可能になったのだと言っている。「喫煙の遺伝学に関して大規模なGWASから得られた最近の知見を踏まえると、これらの遺伝子を第一選択にしない方がよかったと私も思います」と彼は話す。

常識に逆らう

メンデル無作為化は、経済学でよく使われる「操作変数法」にかなり似ている。操作変数法では、操作変数として選んだ変数を使って、他の2つの観察結果同士の隠れた関係性を解きほぐす。「疫学者が遺伝子を操作変数として使っていると知って、我々は興味をそそられると同時に『ちょっと待って!』と申し入れました」とKoellingerは話す。この種の解析は、慎重に精査する必要のある複数の仮定の上に成り立っているからだ。

メンデル無作為化において主要な仮定の1つは、遺伝的バリアントは、それ以外の方法で結果に影響を及ぼしてはならないというものだ。例えば、アルデヒドデヒドロゲナーゼ2(ALDH2)という酵素の遺伝子には、アルコール代謝を損なうバリアントがある。このバリアントは、持つ人が飲酒すると吐き気を催しやすくなるため、下戸と関連付けられている。そこで例えば、飲酒が血圧を上げるかどうかを調べるのにこのバリアントを使うことは、一見もっともらしい方法のように思える。このバリアントを持つ人は一般に、持たない人に比べて飲酒量が少ないからだ。

問題は、ALDH2が喫煙の可能性にも影響し17、喫煙は血圧に対して独立に影響を及ぼすことだ。この「多面発現」と呼ばれる遺伝学上の現象は、メンデル無作為化の結果を無効にしてしまいかねない。また、そこから1つの問題が生じる。多面発現の程度が、多くの遺伝子について十分に分かっていないのだ。

もう1つの主要な仮定は、任意の遺伝的バリアントが強い影響を持つことだ。GWASが大規模で強力になるほど、さまざまな形質との遺伝的関連が弱いものまで拾い出されるため、この仮定の検証はより困難になる。

2015年にオランダの疫学者らが既報のメンデル無作為化解析178件を再検討したところ、これらの仮定を十分に検討したものは半数に満たなかった18。「これらの仮定は、メンデル無作為化解析の有効性を示すために極めて重要なので、常にその研究の特異的文脈において仮定を論じるべきです」と、この疫学者チームは述べている18

メンデル無作為化は、明らかなバイアス発生源の影響も受けることになる。それは生死に伴う問題だ。ヒトの死は1度だけなのである。この問題は、例えば脳卒中による死亡の解析を複雑にする。この種の死亡は高齢者で起こりやすく、そのため脳卒中の研究では通常、若年者が経験する心疾患などの病態を生き延びてきた人々を募集することになる。脳卒中と心疾患には、高コレステロール値といった共通の原因がある(従ってスタチン投与など共通の治療を受けている)ため、こうした「生存者バイアス」が、誤解を生むような結果をいくつかもたらす可能性がある。

このバイアスの影響を明らかにするため、ニューヨーク市立大学(米国)の公衆衛生疫学者Mary Schoolingは、スタチン使用の代わりに、低コレステロール値に関連する遺伝子バリアントを使ったメンデル無作為化試験を行った。この有益な遺伝的素因を持つ人々は、若年期に心臓発作を起こすことが少なく、脳卒中リスクが上昇する年齢まで生きる。そのため、このコホートを用いて解析すると、コレステロール値を下げるスタチンは実際には脳卒中の原因になるだろうという結論が導かれる19

「これでは全く意味をなしません」とSchoolingは話す。適切な無作為化比較試験であれば、このやり方で混乱することはなく、スタチンが脳卒中を防ぐことが明らかになる。しかしメンデル無作為化には「生存者バイアス」が見られ、これを見つけて修正する必要がある。

バイアスとの闘い

「単一の手法だけでは、どんなものでもバイアスがかかる可能性があります」とDavey Smithは話す。彼によれば、メンデル無作為化の目的は無作為化比較試験に取って代わることではなく、観察研究のような他の情報源と共に、入手できる証拠を増やし、十分な情報に基づいた判断を下すのを助けることだという。研究者らは現在、メンデル無作為化を向上させる方法を見つけ出そうとしている。

中国安徽省合肥市。近視を防ごうと目の運動をしている。 Credit: Visual China Group via Getty Images

1つの方法は、バイアスのいくつかを特定して補正したり、統計ツールを使って仮定の堅固さを検証したりすることだ。Davey Smithは、研究者がメンデル無作為化解析の質を自力で評価するのに役立つ論文をいくつか挙げている20

データをより良く体系化することも役立つ可能性がある。バイアスのない解析では遺伝子が無作為に分布すると仮定するが、一部の遺伝子は地理的区域でクラスターになっていることが分かっている21。すでに、大家族ごとに分類された遺伝子型データセットが入手できるようになっている。また、これらのデータのメンデル無作為化解析から、身長とBMI(体格指数)が、従来の研究で示唆されたほどには就学年数に影響していない可能性があることが分かってきている22

遺伝学者らは、家系内や集団に基づく解析の結果を比較して、任意の形質における遺伝と環境の関与を区別するのに役立てることができる。「特定の遺伝子は、局所環境の特徴と相関しています。そして、因果関係の推論に遺伝子を使おうとするなら、そうした関連を断ち切る必要があります」とKoellinger。

この種の正確さは、研究者が公衆衛生や政策上の提言をするために、続々と増える遺伝学情報を役立てたいと考える場合に重要である。しかし、これらのツールにも改良や補足が必要だ。

200年前の学生と兵士の視力に関するWareの観察結果は、当時誰も想像し得なかった「遺伝学のレンズ」を通すことで説明がなされた。皮肉なことに、英国陸軍が眼鏡の必要な志願者を受け入れたり、十分な視力の基準を変更したりするには、それから1世紀かかった。第一次世界大戦の最中でも、一部の専門家は、英国の兵士が射撃の的をはっきり見ることができなくても問題はなく、「正しい方向に向けて撃つ」ことさえできればいいと述べていたくらいだ23

疫学のための統計ツールは向上している。また、メンデル無作為化は必ずしも明瞭な視界をもたらすものではないが、少なくとも研究者を正しい方向へと導いてくれるだろう。

翻訳:船田晶子

Nature ダイジェスト Vol. 17 No. 3

DOI: 10.1038/ndigest.2020.200320

原文

The gene-based hack that is revolutionizing epidemiology
  • Nature (2019-12-12) | DOI: 10.1038/d41586-019-03754-3
  • David Adam
  • David Adamは、英国ロンドン近郊に活動拠点を置くフリーランスのジャーナリスト。

参考文献

  1. Ware, J. Phil. Trans. R. Soc. London 103, 31–50 (1813).
  2. Benn, M., Tybjærg-Hansen, A., Stender, S., Frikke-Schmidt, R. & Nordestgaard, B. G. J. Natl Cancer Inst. 103, 508–519 (2011).
  3. Millwood, I. Y. et al. Lancet 393, 1831–1842 (2019).
  4. Mountjoy, E. et al. Br. Med. J. 361, k2022 (2018).
  5. Davey Smith, G. & Ebrahim, S. Int. J. Epidemiol. 30, 1–11 (2001).
  6. Lippman, S. M. et al. J. Am. Med. Assoc. 301, 39–51 (2009).
  7. Katan, M. B. Lancet 327, 507–508 (1986).
  8. Yarmolinsky, J. et al. J. Natl Cancer Inst. 110, 1035–1038 (2018).
  9. Pierce, B. L., Kraft, P. & Zhang, C. Curr. Epidemiol. Rep. 5, 184–196 (2018).
  10. Okbay, A. et al. Nature 533, 539–542 (2016).
  11. Pickrell, J. K. et al. Nature Genet. 48, 709–717 (2016).
  12. Inoshita, M. et al. Sci. Rep. 6, 26105 (2016).
  13. Hartwig, F. P., Davies, N. M., Hemani, G. & Davey Smith, G. Int. J. Epidemiol. 45, 1717–1726 (2017).
  14. Taylor, A. E. et al. Econ. Hum. Biol. 13, 99–106 (2014).
  15. Wehby, G. L. et al. Biodemography Soc. Biol. 57, 3–32 (2011).
  16. Wehby, G. L. et al. Health Serv. Outcomes Res. Methodol. 11, 54–78 (2011).
  17. Masaoka, H. et al. Drug Alcohol Depend. 173, 85–91 (2017).
  18. Boef, A. C. G., Dekkers, O. M. & le Cessie, S. Int. J. Epidemiol. 44, 496–511 (2015).
  19. Schooling C. M. et al. Preprint at bioRxiv https://doi.org/10.1101/716621 (2019).
  20. Davies, N. M., Holmes, M. V. & Davey Smith, G. Br. Med. J. 362, K601 (2018).
  21. Abdellaoui, A. et al. Nature Hum. Behav. https://doi.org/10.1038/s41562-019-0757-5 (2019).
  22. Brumpton, B. et al. Preprint at BioRxiv https://doi.org/10.1101/602516 (2019).
  23. Cubitt, B. B. Br. J. Ophthalmol. 2, 35–40 (1918).