アフリカツメガエルの難解なゲノムを解読!
生物学者に「あなたの研究分野で最も価値のあるモデル動物は?」と質問してみよう。発生生物学者なら、おそらくアフリカツメガエル(Xenopus laevis)をリストの最上位付近に据えるはずだ。一方、遺伝学者はこの動物をトップ10にすら入れないだろう。この違いはどうして生じるのか? その理由の1つに、アフリカツメガエルのゲノムが「全ゲノム重複」によって複雑化していることが挙げられる。この複雑さゆえに、現代の遺伝学では必須の「ゲノムアセンブリ(ゲノムDNA断片配列の再構築)」が極めて困難になっているのだ。ところが今回、カリフォルニア大学バークレー校(米国)のAdam Sessionらは、この大きな困難を克服してアフリカツメガエルのゲノム塩基配列解読に見事成功し、その結果をNature 2016年10月20日号336ページに報告した1。生物学のさまざまな分野を大きく推し進めることになるこの偉業は、最先端の技術と大規模な国際コンソーシアム(日本からは東京大学など18機関が参加)による精力的な研究によって成し遂げられた。
ヒトをはじめとする二倍体(ゲノムを2組持つ)生物のゲノム解読では、ゲノムアセンブリによって、各染色体対に対応する1本の塩基配列を決定し、参照配列とすることができる。これに対し、アフリカツメガエルは、異質四倍体(異なる種に由来する2種類のゲノムを2組ずつ計4組持つ)生物であるため、よく似た2本の参照配列が含まれる(つまり多くの遺伝子は1コピーではなく、よく似た2つのコピーが保持されている)。ゲノム塩基配列解読法として一般的なショットガン法では、何億というランダムな短い読み取り配列の断片を得た後、それらをコンピューターで論理的につなぎ合わせることで連続した1つの配列を再構築(アセンブリ)するが、異質四倍体のようにゲノムが重複していると、短い配列の断片が2つの遺伝子コピーのどちらに由来するのかの判断が困難になることがある。2つのコピーで配列が似過ぎていると、アセンブリプログラムのアルゴリズムはそれらの重複した配列を単一コピーとして「圧縮」してしまい、結果として得られた配列は2つのコピーに由来する断片のつぎはぎとなってしまうのだ。そのため、これを改善し、全ての染色体を端から端まで正確に再構築するべく努力が続けられた。
今回、こうした重複染色体の区別を可能にしてSessionらを成功に導いたのは、ある2つの手間と時間を要するアプローチだった。1つ目のアプローチでは、研究チームはまず、アフリカツメガエルの1個体のDNAから得た長鎖DNA断片(100キロ塩基以上)を、プラスミドベクターである「細菌人工染色体(BAC)」に挿入した。そしてその中から、体系的に798個のBACクローンを選別し、重複した遺伝子の一方のコピーを含むBACクローンともう一方のコピーを含むBACクローンの「対」を特定した。次に、こうして得られたBACクローンをもとに、「DNAプローブ」の対が作製された。プローブ対はそれぞれ別の蛍光分子で標識されていて、これらのプローブ対を染色体に同時にハイブリダイズさせることにより、蛍光の違いに基づいて2つの重複遺伝子をそれぞれ正しい染色体に特異的に割り当てることができる。この手法によって、断片化している塩基配列を染色体ごとに正しくつなぎ合わせて大きな配列を得ることが可能になり、ゲノムアセンブリが大きく改善された。
2つ目のアプローチは、「繋ぎ止め染色体コンホメーション捕捉法」という手法で、密に折りたたまれたDNAの複数の領域を互いに架橋させてから、DNAの断片を対の形で塩基配列の解読をするというものだ。こうした架橋はほとんどが同一染色体内のものだが、架橋された配列間の距離は数百キロ塩基に及ぶことがあるため、断片的な配列を同一染色体上の別の配列とつなぎ合わせて、より大きな連続した配列を構築することができる。これら2つの技術によって、研究チームは重複した塩基配列を別々の染色体に分離して、高精度のゲノム塩基配列を得ることに成功した。
アフリカツメガエルのゲノム塩基配列解読は、それだけで十分興味深く意義のある成果だが、Sessionらの研究はそこでは終わらなかった。彼らは、得られた塩基配列を利用して、さらにこの独特なモデル動物のゲノム進化の謎の解明に挑んだのである。
進化の道筋をつなぎ合わせる作業は通常いくつかの異なる種を比較して行われるが、全ゲノム重複を経験した種では、その種だけを見て進化の過程を理解する機会が得られる。全ゲノム重複の後、同じ機能を持つ重複遺伝子は、時とともにいくつかの変化を遂げる可能性がある。例えば、一方のコピーで不活性化変異が生じたり(この変異が生じたコピーは遺伝子としての機能を失い、偽遺伝子となる)、共有されていた複数の機能が2つのコピーに分割されたり、一方のコピーが祖先的な機能を維持しつつもう一方のコピーが新たな機能を獲得したりする(図1)。十分な時間があれば、全ゲノム重複を経て四倍体になった生物も、全ての遺伝子が進化的に重要な独自の機能を有する二倍体の状態に戻る。この「再二倍体化」と呼ばれる過程は、脊椎動物の進化の過程で実際に何回か起きている2。
今回明らかになったアフリカツメガエルのゲノムでは、各染色体対において、一方の「サブゲノム」が載っている染色体セットはもう一方のセットよりわずかに長さが短く、重複ゲノム間に違いが見られた。研究チームはこれらのサブゲノムを、長い染色体セットに載っている方を「L」、短い方を「S」と名付けて区別した。各サブゲノムに含まれる転位因子の活性と偽遺伝子の年齢から、彼らはLとSをもたらした2つの祖先種が、約3400万年前に分岐して誕生し、その後約1800万年前に種間交雑してアフリカツメガエルの系統を生じたと推定した。アフリカツメガエルは、重複したゲノムを持つ脊椎動物の中で、この3年間に塩基配列が解読されたもののうち、ニジマス(Oncorhynchus mykiss)3、コイ(Cyprinus carpio)4、タイセイヨウサケ(Salmo salar)5に次いで4番目になる。この4種のうち、全ゲノム重複が起こった時期が最も新しいのはコイで、わずか800万年前だった。一方、最も古いのはニジマスの9600万年前で、タイセイヨウサケの8000万年前がそれに続く。今回明らかになった約1800万年前というアフリカツメガエルの全ゲノム重複の時期は、年代的にタイセイヨウサケとコイの間に位置する。しかしアフリカツメガエルの塩基配列解読がこれらの魚類の解読と異なる点は、異質倍数体の動物種で2つのサブゲノムが初めて同定されたことである。
アフリカツメガエルのゲノムでは、重複で生じたタンパク質をコードする遺伝子の56%以上が保持されていることが分かった。これらの遺伝子では、バランスのとれた発現レベルの維持が必要であると考えられる。一方、非コードエレメント(遺伝子発現を調節するエンハンサーやプロモーターなどの配列である可能性が極めて高いゲノム領域)のうち、脊椎動物で保存されているものについてはよく保持されているのに対し、近縁種であるネッタイツメガエル(X. tropicalis)との間で保存されているものは保持率が著しく低かった。このことは、重複ゲノムでは調節エレメントの変化の自由度が高く、進化が加速される、という考え方と一致する。
興味深いことに、アフリカツメガエルの2つのサブゲノム間では、遺伝子の失われ方に大きな違いが見られた。サブゲノムLではより祖先的な状態に近いのに対し、サブゲノムSでは染色体の再編成が多く、Sでの遺伝子欠失はLの約3〜4倍に上った。こうした非対称的なサブゲノムの進化がなぜ起こったのかは不明だが、もしかすると、全ゲノム重複で出現したこの新種のカエルに、サブゲノムLをもたらした祖先種と高い適合性を示す生理的側面があったために、このサブゲノムが優位に保持されてきたのかもしれない。研究チームはさらに、ある特定の機能カテゴリーに属する遺伝子が、2つのコピーの両方で保持される傾向が高いことも見いだした。こうした傾向は特に、DNAと結合するタンパク質や、発生段階により調節されるシグナル伝達経路のタンパク質をコードする遺伝子で見られた。彼らはその理由の1つとして、転写因子やシグナル伝達分子は、化学量論的な発現制御が必要であったり機能分化を起こしたりしていることが予想されるため、他の多くのタンパク質以上にコピー数の変化に敏感である可能性を挙げている。
最後に研究チームは、アフリカツメガエルの重複遺伝子の多くで、発現が時空間的に一様でないことも明らかにした。こうした遺伝子発現の変化は、遺伝子発現を重複した非コードエレメントの分子進化と結び付けるよい機会となる。言い換えれば、エンハンサー配列の変化を遺伝子発現の変化と相関させられる可能性があり、このような変化は、同一種内の同一遺伝子のもう一方のコピーに照らして評価することができるため、原因を示す強力な証拠になるのである。
アフリカツメガエルのゲノム塩基配列が解読され、利用可能になったことの意義は実に大きい。発生生物学者は、現代の生物学に欠かせない詳細なゲノム情報を自由に使うことができるようになり、ゲノム生物学者は、大きくて複雑な重複ゲノムであっても最終的には高精度のアセンブリが可能であることの証拠を手にした。そして進化生物学者は、進化の過程における遺伝子の誕生と死、そしてそれらの調節エレメントを調べるための、また別の強力なツールを得たのである。アフリカツメガエルは、今回モデル動物として見事に大きく飛躍した。次は科学者たちの番だ。
翻訳:小林盛方
Nature ダイジェスト Vol. 14 No. 1
DOI: 10.1038/ndigest.2017.170129
原文
Genomics: A matched set of frog sequences- Nature (2016-10-20) | DOI: 10.1038/538320a
- Shawn Burgess
- Shawn Burgessは米国立衛生研究所(NIH;メリーランド州ベセスダ)に所属。
参考文献
- Session, A. M. et al. Nature 538, 336–343 (2016).
- Ohno, S. Evolution by Gene Duplication (Springer, 1970).
- Berthelot, C. et al. Nat. Commun. 5, 3657 (2014)
- Xu, P. et al. Nature Genet. 46, 1212–1219 (2014).
- Lien, S. et al. Nature 533, 200–205 (2016).