News

「プラチナ」ゲノムで疾患に迫れ

遺伝学者には、後ろめたい小さな秘密がある。「ヒトゲノム計画」の正式な完了から10年以上が経ち、いくども改訂が発表されていながら、その配列にはなお数百カ所のギャップと呼ばれる未解読部分が存在するのだ。その上、ギャップの多くは疾患と関連する領域にある。現在、複数の研究チームが、真に完全なヒトゲノム配列、いわゆるプラチナゲノムに迫ろうとしている。

「言ってみれば、欧州の地図を大勢で描いていて、誰かが『ああ、ノルウェーを描かないと。でも、フィヨルドを描くのは面倒だから私はやりたくない』と言うようなものです。今は、それを描いている人がいるのです」。こう例えるのは、ヒトゲノム計画に参加していた欧州バイオインフォマティクス研究所(EMBL;英国ケンブリッジシャー州ヒンクストン)の計算生物学者Ewan Birneyだ。

最近、ゲノム1組だけを得られる特異なヒト細胞株のDNAを用いて、より精緻なヒトゲノム解読が行われている。2014年11月には、自閉症や神経変性疾患「筋萎縮性側索硬化症(ALS)」などの病態との関係が明らかになっている領域のギャップの解読が進んだことが報告された。

2000年、当時の米国大統領ビル・クリントンは、最先端の科学者とともに「概要ヒトゲノム」を発表した。ヒトゲノム計画として知られるこの取り組みは3年後には完了が宣言されたが、但し書きがついていた。ヒトの「標準」ゲノムの99%以上は完成されていたが、当時の技術では100%にできなかったのだ。

配列を解読する装置(シーケンサー)は、染色体を丸ごと処理することができないため、最初にDNAのコピーを大量に作製し、それをさまざまな部位で切断して短い断片にする。シーケンサーで断片の配列を読んだ後、重なったパターンをコンピュータープログラムが探し、得られた断片をつなぎ直す。

この方法は散弾銃のようにさまざまなゲノム断片を生成することから全ゲノムショットガン法と呼ばれ、ゲノムの大部分に有効だった。DNA配列は30億個のA、C、T、Gという4つの「文字」の連なりであるが、この並び順はヒト全体でほぼ同じだからだ。しかしヒトは、両親から細部が微妙に異なる染色体を1組ずつ受け継いでおり、一対の染色体であっても相互で大きく違う領域が存在する。そうした領域のDNA配列をつなぎ合わせて明らかにしようとすると、異なる配列から矛盾する答えが出た。これがギャップとなった。

例えると、似ているが同じではないジグソーパズルが複数セット混ざった状態で、1セットのジグソーパズルを組み立てる作業に近いといえる。あるピースの形が全てのセットで同じなら、どのセットのピースでもかまわない。しかし、はめ込んだピースが本来はまるはずだったものより大き過ぎたり、あるピースが欠けていたりすれば、そのパズルは完成させられなくなる。特に、遺伝子のそばの長い反復的な配列は、コンピューターアルゴリズムを苦しめた。そして、複数の人のDNAが利用されてゲノム間のばらつきが大きくなったことで、問題は悪化した。

結果として、例えば、ある人の疾患の原因を探す目的でゲノム配列解読を行っても、カギとなる部分が公式ヒトゲノム配列に記されていない場合は見過ごされる可能性があるという状態だ。プラチナゲノム研究推進派の中心人物であるワシントン大学(米国シアトル)のゲノム科学者Evan Eichlerは、「得られていない遺伝的変異には、あらゆるレベルのものがあります」と話す。ギャップを埋めるには、ただ1組の染色体しか持たないヒト細胞が必要なのだ。

精子と卵細胞は各染色体を1組しか持たない細胞だが、分裂して自らのコピーを作り出すことができない。そのため近年、遺伝学者は胞状奇胎と呼ばれる増殖物の細胞に着目している。胞状奇胎は、遺伝物質が消失してしまった卵に精子が結合したときに形成される(「配列を単純化する」参照)。受精後、細胞はゲノムを複製し、正常な受精卵と全く同じように分裂し始める。このとき作られる細胞塊は、通常は受胎後最初の3カ月間のうちに排除されるが、そこに含まれているのはヒト染色体1組の同一コピーだ。

1990年代前半には、そうした胞状奇胎の1つから採取された細胞をもとに、CHM1と呼ばれる細胞株が樹立された。Eichlerらは、CHM1ゲノムの一部を利用して公式のヒトゲノム配列の特に厄介な穴のうちの約50カ所を埋めたことを明らかにし、2014年11月10日付のNatureオンライン版で報告した1。研究チームはさらに、ALSおよび脆弱X症候群(症状が自閉症と類似する精神発達疾患)と関係する遺伝子の内部のものを含め、さらに多くのギャップを狭めたことも併せて報告している。合計すると、もとの標準ゲノムになかったDNAの文字が約100万個明らかにされたことになる。

しかし、空白が残されていないことを確かめるためには、ただ1組のゲノムから組み立てられている必要がある。これが「真のプラチナ配列」であろう。

真のプラチナ配列を得ることを目標として、ワシントン大学(米国ミズーリ州セントルイス)のRichard Wilsonを中心とする研究チームは、 2014年11月初頭にCHM1ゲノム全体の概要配列を発表した2。同じくパシフィックバイオサイエンス社(米国カリフォルニア州メンローパーク)の研究チームも、CHM1の全ゲノム配列解読に取り組んでいる。同社は平均10kb以上の連続した長いDNA配列を読むことが可能な独自のシーケンサーを開発しており、この装置で得られた配列は通常のシーケンサーに比べてギャップが少ない。同社は、この方法で組み立てた概要ゲノムを2014年2月に発表している。同社の手法によりプラチナゲノムの完成が加速すると期待されている。

一方、パーソナリス社(米国メンローパーク)のゲノム科学者Deanna Churchは、「ある1組のゲノムについてなら、完全な塩基配列が得られる可能性はずいぶん高くなっていると思います」と語る。しかし、Birneyによれば、ヒトの標準ゲノムで求められているのは、完成よりも「絶え間ない改訂」なのだという。「間違いなく、誰かがこの問題で10年か20年の時を空費するでしょう」とBirneyは慎重な見方を示している。

翻訳:小林盛方

Nature ダイジェスト Vol. 12 No. 2

DOI: 10.1038/ndigest.2015.150210

原文

Platinum’ genome shapes up
  • Nature (2014-11-20) | DOI: 10.1038/515323a
  • Ewen Callaway

参考文献

  1. M. J. P. Chaisson et al. Nature http://doi.org/w69 (2014).
  2. K. M. Steinberg et al. Genome Res. http://doi.org/w7b (2014).