Highlight

予想と現実のギャップを埋める

Nature Reviews Genetics

2005年3月1日

コンピューターを用いたDrosophilaのゲノムに関する遺伝子予測の結果を検証するための新たな系統的方法を使ったところ、これまでに塩基配列が解読された真核生物のゲノムにおける未同定遺伝子の数は、予想をはるかに下回っている可能性が非常に高いという結果が出た。

「最小限、いくつの遺伝子があれば、生物ができあがるのか」という白熱した論争は、完全ゲノム配列が解明されれば、ほぼ決着を見るだろうと考えられていた。ところが塩基配列から遺伝子を予測する計算論的方法の有効性については見解の相違が残った。Drosophilaのゲノムに関する遺伝子予測が、その典型例だ。数多くの予想遺伝子が遺伝子間領域に位置しており、この予想が正しいのかどうかを判定するための標準的な方法について研究者間での合意がないため、遺伝子の総数をめぐる議論では、反対説が次から次へと登場している。

Mark Yandell、Adina Bailey、Sima Misraたちの考え抜かれた研究は、この議論に最終的な決着をつけることを目指した。この研究では、コンピューターによる予測(GENSCANによる9,811件とFGENESHによる375件)あるいはマイクロアレイを使った検証実験(1,266件)によって同定されたDrosophila melanogasterゲノムの遺伝子間領域に位置する予想マルチエキソン遺伝子を大量に集めた。

そしてYandellたちは、これらの予想遺伝子の一部についてさまざまな要件に基づく分類を行って検証し、そのうちの何%が実際の遺伝子転写産物と対応しているかを調べた。一対の予想エキソン内の部位のために設計されたプライマーから生成されたRT-PCR産物によって得られた塩基配列に転写産物のスプライシングがあれば、予想遺伝子の妥当性が認定された。

一般に、遺伝子予測の信頼性はあまり高くなかった。検証の行われた予想遺伝子のうち妥当性が認定されたのは16.4%(744件中122件)で、スプライス部位の保存性という基準を用いた検証では、最も数多くの予想遺伝子の妥当性が判定できた(174件中64件、37.4%)。Yandellたちは、この判定結果をDrosophilaゲノムに関する遺伝子予測全体に類推し、これまでに同定されていないタンパク質をコードする遺伝子の数を約700個と予測した。その結果、Drosophilaの遺伝子の総数は、約14,000個と予測された。これは、これまでに提示された諸説の中で最も少ない部類に属している。

他の生物のゲノムで未同定のタンパク質をコードする遺伝子を探している研究者にとって、Yandellたちの研究成果には、2つの教訓が含まれている。1つは、コンピューターによる遺伝子予測結果は相当に割り引いて受け止める必要があること。もう1つは、もしも未同定部分の実状を知りたければ、Yandellたちみたいに系統的実験方法を用いて遺伝子予測結果の一部を検証すればよいということだ。

doi:10.1038/fake491

「レビューハイライト」記事一覧へ戻る

プライバシーマーク制度