遺伝学:ヒトパンゲノムの概要参照配列が初めて発表される
First draft of a human pangenome
doi: 10.1038/s41586-023-05896-x
doi: 10.1038/s41586-023-05896-x
doi: 10.1038/s41587-021-01195-w
最近のENCODEプロジェクトの結果によれば、ヒトゲノムの70%以上が転写されるが、全てが同じタイプの細胞で起こることは絶対にないといい、自然界には長鎖RNA、低分子RNA、マイクロRNA、さらには環状RNAまで、さまざまなRNAが見いだされている。このように著しく多様な転写物を研究するために数多くの手法が開発されているが、その中で最も網羅的で強力なものがハイスループットのRNA塩基配列解読(RNA-seq)である(News and Views, p. 882)。このRNA-seq、特に大規模共同研究でのRNA-seqの利用が、今回の「RNAの塩基配列解読の品質管理(SEQC)」特集のテーマである。
この特集で掲載する5編の論文のうちの3編では、SEQCプロジェクトの研究成果が報告されている。SEQCプロジェクトは、実験室横断的なRNA-seqデータの比較可能性の評価とともに、さまざまな塩基配列解読プラットフォームとデータ解析法の評価およびそれとDNAマイクロアレイとの比較性能評価を目的とし、米国食品医薬品局(FDA)のマイクロアレイ精度管理(MAQC)コンソーシアムによって推進されている。
このプロジェクトの主な結果は、RNA-seqを用いてスプライスジャンクションの検出と差次的遺伝子発現の解析(発現亢進遺伝子と発現低下遺伝子の特定)を行う複数の研究グループにおいて、適切なバイオインフォマティクス的方法を利用すれば、再現性のある確かな結果が得られることを明らかにしたが、絶対的遺伝子発現量の計測とさまざまな転写物アイソフォームのプロファイリングが課題として残っている(Article, p. 903)。ABRF(Association of Biomolecular Resource Facilities;生体分子リソース施設協会)による独立した研究では、MAQCの試料を用いて補完的解析が行われたが、長い塩基配列を解読するシーケンサーと半導体シーケンサーが使用され、異なるRNA調製プロトコルの評価も行われた(Article, p. 915)。特筆すべきは、分解したRNA試料によるRNA-seqに有効なプロトコルをABRFが明らかにしたことで、これがRNA-seqの臨床応用に重要なホルマリン固定パラフィン包埋組織のトランスクリプトーム解析に新しい可能性を開いている。
RNA-seqとマイクロアレイとで遺伝子発現計測結果の一致率を評価することは、この分野のもう1つの重要な問題であり、それは古いマイクロアレイデータとRNA-seqデータとの比較で特に重要性を増す。SEQCプロジェクトの第2の論文は、有害化学物質に曝露されたラットの肝試料を用いる遺伝子発現解析に関するもので、RNA-seqデータとマイクロアレイデータの一致率が化学物質によって誘起された撹乱の強度に依存することが判明した(Article, p. 926)。
複数のRNA-seqデータセットの比較を適正に行うには、塩基配列解読の実施施設、機器、プロトコルの違いによる偏りを処理するために正規化を必要とする。SEQCプロジェクトの第3の論文にはさまざまな正規化法の評価が示され、複数の実施施設に試料を配布するように計画された試験に有効なものも明らかにされている(Analysis, p. 888)。外部からスパイクイン対照RNAを添加して各試料に混入させれば正規化が容易に行われると考えるのはもっともであるが、実際には、アッセイの偏りがスパイクインRNAに及ぼす影響が試料中の他のRNAと異なる場合がある。このことからスパイクインデータ内のアッセイの偏りを処理する初めてのアルゴリズム的方法を開発する必要が生じた(Analysis, p. 896)。以上を総合すると、こうした正規化研究は、スパイクインを含む試料のデータを評価および可視化するERCC(External RNA Control Consortium;外部RNA標準コンソーシアム)の新しいツール(Munro et al. Nat. Commun.、近刊)とともに、スパイクイン対照を利用しやすいものにすると考えられる。
多くの課題が残されているが、今回報告された施設横断的な多プラットフォーム研究は、探索研究と臨床使用を目的とする大規模コホートのRNA-seq解析に向けた第一歩となる(News and Views, p. 884)。将来的には、ロボット工学の新たな展開や「サービスとしてのライブラリー作製」がRNA-seqの再現性を向上させるための戦略となることが考えられ(News and Views, p. 882)、「意義不明の転写物」のような新しい概念を定義することによって臨床解析に存在するゲノムの「意義不明の変異」を補完する必要が生ずる可能性もある(News and Views, p. 884)。
doi: 10.1038/nbt.3015
doi: 10.1038/nbt.3017
doi: 10.1038/nbt.2957
doi: 10.1038/nbt.2972
doi: 10.1038/nbt.3001
doi: 10.1038/nbt.2931
doi: 10.1038/nbt.3021
doi: 10.1038/nbt0914-847
doi: 10.1038/nbt0914-849c
doi: 10.1038/nbt0914-849b
doi: 10.1038/nbt0914-849d
doi: 10.1038/nbt0914-849a
doi: 10.1038/nbt0914-851b
doi: 10.1038/nbt0914-851c
doi: 10.1038/nbt0914-851a
doi: 10.1038/nbt0914-852a
doi: 10.1038/nbt0914-852b
doi: 10.1038/nbt0914-853
doi: 10.1038/nbt0914-854
doi: 10.1038/nbt0914-855b
doi: 10.1038/nbt0914-855a
doi: 10.1038/nbt0914-855c
doi: 10.1038/nbt0914-856
doi: 10.1038/nbt0914-857
doi: 10.1038/nbt0914-858
doi: 10.1038/nbt.3008
doi: 10.1038/nbt.3013
doi: 10.1038/nbt.3010
doi: 10.1038/nbt.2943
doi: 10.1038/nbt.2951
doi: 10.1038/nbt.2969
doi: 10.1038/nbt.3000
doi: 10.1038/nbt.3004
doi: 10.1038/nbt.3003