Article

大規模なRNA塩基配列解読データから無用の変動を除去するPRPS

Nature Biotechnology 41, 1 doi: 10.1038/s41587-022-01440-w

特に大規模で複雑な研究から得られたデータの場合、RNA塩基配列解読(RNA-seq)データから意味のある生物学的結果を導き出すためには、無用の変動を正確に特定して効果的に除去することが不可欠である。がんゲノムアトラス(The Cancer Genome Atlas;TCGA)のRNA-seqデータを用いて、我々は無用の変動を生むいくつかの原因を調べ、それが、がんのサブタイプの発見、遺伝子発現と生存転帰との関連、および遺伝子共発現解析など、さまざまな下流の解析をどう著しく損ない得るかを今回示した。本論文では、我々が最近開発したRUV-III(removing unwanted variation III)という正規化法を展開するためのPRPS(pseudo-replicates of pseudo-samples)という戦略を提案する。これは、ライブラリーのサイズ、腫瘍の純度、およびバッチ効果によって引き起こされたTCGA RNA-seqデータ中の変動を除去するものである。我々の手法の価値は、複数のTCGA RNA-seqデータセットで標準的なTCGA正規化法と比較することによって示された。RUV-IIIをPRPSと共に用いることにより、さまざまな研究室やプラットフォームから生み出される他の大規模なトランスクリプトームデータセットを統合して正規化することができる。

目次へ戻る

プライバシーマーク制度