News

論争が続くRNA研究

Nature ダイジェスト Vol. 9 No. 7 | doi : 10.1038/ndigest.2012.120729

原文:Nature (2012-04-26) | doi: 10.1038/484428a | RNA studies under fire

Erika Check Hayden

注目を浴びたRNA配列解読研究に、統計学的な欠陥があると異議が。

ここ数年間、ハイスループットRNAシーケンシング技術によって、いくつかの予想もしなかった結果がもたらされた。この中には遺伝学の一般通念を書き換えるようなものもある。しかし、計算生物学者たちは、データ量の多い研究に潜む統計学的な落とし穴について注意を促しており、現在、このような革新的な結果のいくつかに対して異議が申し立てられている。

最近では、インプリンティング遺伝子の研究が論争の的になっている。ヒトをはじめとするほとんどの動物は、大部分の遺伝子を、両親のそれぞれから1コピーずつ、合計2コピー受け継いでいる。しかし場合によっては、そのうちの1コピーしか発現せず、もう1コピーは抑制されていることがある。このような場合、遺伝子はインプリンティングを受けているという。2010年7月、当時ハーバード大学(米国マサチューセッツ州ケンブリッジ)に所属していたCatherine DulacとChristopher Greggが率いた研究チームは、Scienceに1300個のマウス遺伝子がインプリンティングを受けていると見積もった研究結果を発表した1。これは、これまでに知られていたよりも一桁も多い結果だった。

現在、この論文の解析には欠陥があり、そのためDulacとGreggはインプリンティング遺伝子を非常に過剰に見積もったのだと主張する研究者たちが現れ、論争になっている。「この論文がScienceに掲載された理由は、インプリンティング遺伝子がこれまで考えられていたより一桁も多い結果が提示されたからですが、私は、これが事実であるとは思えません」と、スタンフォード大学(米国カリフォルニア州)の計算生物学者Tomas Babakは語る。Babakは、2012年3月29日に論文を発表し、DulacとGreggの研究に異論を唱えている2

Dulacらは「データの取り下げなんて、絶対にしません」と反論し、別の方法で自分たちの知見のいくつかを確認したと付け加えた。この状況は、2011年にペンシルベニア大学(米国フィラデルフィア)のVivian Cheungの率いる研究チームが発表したRNA配列解読論文3で生じている論争に似ている(Nature ダイジェスト 2011年8月号13ページ参照)。この論文では、RNAエディティング(これにより、ある遺伝子のDNA配列とそれから生じるRNA配列の間に違いが生じる)はヒトゲノムで「一般的に行われている」とする証拠が報告された。RNAエディティングは以前から知られていたが、Cheungらの結果は、RNAエディティングの頻度が非常に高く、生物の遺伝子は忠実に転写されるとするセントラルドグマの書き換えにもつながる。

ほかの研究者たちは、Cheungらの結果は主に誤ったデータ解析から得られたもので、RNAエディティングの真の範囲はおそらくこれまでに考えられていた程度4であろうと主張している。NatureはこのことについてCheungにコメントを求めたが、回答はなかった。Cheungは結果を取り下げていない。

DulacとGreggは、ハイスループットRNAシーケンシング技術を用いて、マウスのRNAの一塩基多型(SNP:遺伝子配列の一文字変化)を探索し、各遺伝子に見つかったSNPが一方の親、あるいは両親に追跡できるかどうかを検討した。そして、SNPが主に一方の親の遺伝子コピーにコードされる場合、その遺伝子はインプリンティングを受けていると結論した(「遺伝子の抑制」を参照)。

しかしBabakは、DulacとGreggが使用した統計的手法は偽陽性を除外できるほど厳密ではなかった、と言う。Babakのチームは複数の方法を用いて、false discovery rate(FDR:多重検定の際の有意水準指標の1つ)を推定した。例えば、インプリンティングと考えられる場合の基準をより厳しくしたり、同一の遺伝的背景のマウスを交配した場合に偶然に偽のインプリンティングが何回出現するかを推定したりしたのである。次に、Babakの研究チームは、そのFDRをDulacとGreggのデータに適用し、彼らの論文で同定されたインプリンティングを受けている場合の大部分がおそらく偽陽性であろうと結論した。Dulacはこれに反論し、Babakの解析では、複雑なインプリンティングを受けている本物が除外されている可能性があるとしている。

「最初の数報の論文でこのような問題が起こったのは、一般的に、統計解析がそれほど注意深く行われていなかったためです」と、カリフォルニア大学バークレー校の計算生物学者Lior Pachterは言う。「そのため、完全に間違った答えが得られたのかもしれません」。DNAシーケンシング技術では、誤りと偏りを最小にするための標準的方法が何年もかけて開発されたが、ハイスループットRNAシーケンシング技術については、まだそのような標準的方法が開発されていないのだ。

Pachterは、別の重要課題として、この分野で注目を浴びる論文は、その生物学的意義についてはよく審査されるが、その基盤となった計算学については審査されていない可能性があると語る。「生物学における慣習は、統計学や数学と同じではありません。統計学や数学では、査読者は1つの論文に何か月も取り組み、統計および数学の正当性を確認し、プログラムを動かして検討するのです」と、Pachterは語る。

この論争は、比較的新しい方法を用いて異例の遺伝学的現象を同定するにあたり統計学が必要な、配列解読を基盤とするあらゆる研究に影響を与える。このような種類の実験では、「解析データを非常に注意深く扱わなければ、ノイズに対するシグナルの比が低いため、めんどうなことになるでしょう」と、CheungのRNAエディティングの論文に異議を唱えた研究者の1人、スタンフォード大学(米国カリフォルニア州)のゲノミクス専門遺伝学者Jin Billy Liは語る。

現在、Dulacの研究チームは異なる統計的手法を用いて、インプリンティングについてのデータを再解析している。Dulacは、「2010年の論文で報告したのとほぼ同じ桁の結果が得られるでしょう。かなり自信があります」と語っている。

(翻訳:三谷祐貴子)

参考文献

  1. Gregg, C. et al. Science 329, 643–648 (2010).
  2. DeVeale, B., van der Kooy, D. & Babak, T. PLoS Genet. 8, e1002600 (2012).
  3. Li, M. et al. Science 33, 53–58 (2011).
  4. Check Hayden, E. Nature http://dx.doi.org/10.1038/nature.2012.10217 (2012).

キーワード

Nature ダイジェスト Online edition: ISSN 2424-0702 Print edition: ISSN 2189-7778

プライバシーマーク制度