News

ヒト疾患の巨大遺伝子バンクを作って病因を探る

近年、DNAの塩基配列決定のペースが上がったことで、膨大な量のDNAサンプルやデータが蓄積してきている。

JOE RAEDLE/GETTY

2013年の初頭、3人の研究者が、別々の大規模プロジェクトで収集された遺伝子データをまとめるHaplotype Reference Consortium(HRC)を立ち上げた。彼らの目標は、ヒトの遺伝子多様体(DNAの塩基配列のうち人によって違いがある点)を網羅する世界一のカタログを作成することにある。そうした単一の参照データベースがあれば、希少疾患を引き起こす遺伝子多様体を探している研究者の役に立つはずだ。

大きな研究チームによって進められてきた過去の「ビッグデータ」プロジェクトとは違い、このプロジェクトは意図的に規模を小さく抑えていて、アナリストは5人しかいない。発足から2年近く経過した現在、彼らは、他の23の研究コラボレーションが収集した全ゲノム配列データから約5000万の遺伝子多様体を突き止めた。そして、2014年10月20日には、サンディエゴ(米国カリフォルニア州)で開催された米国人類遺伝学会の大会でデータベースが公開される。

遺伝学者はこれまで、データ提供に必ずしも協力的ではなかった。けれども近年、そうした風潮に変化が生じているようだ。オックスフォード大学(英国)の統計遺伝学者でHRCのリーダーの1人であるJonathan Marchiniは、「データの統合は驚くほど容易でした。この分野の研究者は皆、非常に好意的で、私たちのプロジェクトの意義をよく理解し、データを利用できるように骨を折ってくれました」と話す。

過去5年間で、ヒトゲノムの配列決定のペースは爆発的に上がった。その一方で遺伝学者たちは、遺伝子を疾患や形質と結び付けるためには、どんな研究センターにも単独では収集できないほど大規模なサンプルが必要であることに気付き始めた。

かつては、一般的な疾患や形質をたどっていくと少数の共通の遺伝子多様体に行き着き、それらを発見するのは比較的容易であると考えられていた。けれども、その予想は間違っていた。現在では、身長や統合失調症に罹患するリスクなどは、数千種類の多様体がそれぞれ小さく寄与することで決まることが分かっている。これだけ多くの多様体を発見するためには途方もない人数のDNAを調べなければならないが、DNAの塩基配列決定のペースが上がってきたことで、こうした多様体を発見できるだけのゲノムデータを収集することが可能になった。

マサチューセッツ総合病院(米国ボストン)の遺伝学者Daniel MacArthurは、「HRCのデータは、別々の研究チームがそれぞれ数百万ドルの費用をかけて収集したものです。これだけのデータを共通の研究資源として利用させてくれる人々がいるのは、素晴らしいことです」と言う。

ヒトの遺伝子多様体の巨大ライブラリを構築する試みには、HRCの他にExome Aggregation Consortium(ExAC)があり、MacArthurはそのメンバーである。MacArthurらは、2014年10月20日、他の研究者たちが収集した6万3000人分ものエキソーム(タンパク質をコードする部分)のデータベースを公開する。「非常に大きい集団を調べることで、希少な多様体がどのように分布しているかを検討することが可能になります。この手法は非常に強力です」とMacArthurは言う。

MacArthurは、データの中から遺伝子の機能を失わせるような突然変異を探し出すためのツールを開発しているところである。こうした「機能喪失」変異の一部だけが有害な影響を引き起こすため、どの変異が疾患を引き起こすかを予測するには、健常者でよく見られる変異についてもっとよく知る必要がある。

大規模データを活用した研究の中には、すでに成果を報告しているものがいくつかある。例えば、2014年10月5日に発表された「身長」の遺伝学に関する論文1では、25万人以上のデータが利用されている。そのデータは、遺伝子多様体と形質や疾患との相関を調べる別々のゲノムワイド関連解析で収集されたもので、Genetic Investigation of Anthropometric Traits(GIANT)コンソーシアムの一環として集められた。論文によると、以前の研究で突き止められた遺伝子多様体の3倍以上に上る697個の新たな多様体が身長と関連付けられた。しかし、研究チームの見積もりによると、今回突き止められた遺伝子多様体を全部合わせても、身長への遺伝的寄与のわずか16%にしかならないという。

ブロード研究所(米国マサチューセッツ州ケンブリッジ)の遺伝学者でGIANTコンソーシアムのリーダーJoel Hirschhornは、さらに多くのデータが集まれば、未知の遺伝要因がもっと明らかになるだろうと期待している。

翻訳:三枝小夜子

Nature ダイジェスト Vol. 12 No. 1

DOI: 10.1038/ndigest.2015.150121

原文

Giant gene banks take on disease
  • Nature (2014-10-16) | DOI: 10.1038/514282a
  • Erika Check Hayden

参考文献

  1. A. R. Wood et al. Nature Genetics 46, 1173– 186 (2014).