Letter

RNA-Seqによる転写物の組み立ておよび定量から細胞分化中のアノテーションされていない転写物およびアイソフォームスイッチングが明らかとなる

Nature Biotechnology 28, 5 doi: 10.1038/nbt.1621

高処理能mRNA配列解読法(RNA-Seq)は、転写物の発見と量の推定とを同時に行うことが期待されている。しかし、そのためには、事前の遺伝子アノテーションに制限されず、選択的な転写およびスプライシングを説明するアルゴリズムが必要となる。本論文では、Cufflinksと呼ばれるオープンソース・ソフトウェアプログラムのそうしたアルゴリズムを紹介する。Cufflinksを検証するため、一連の分化段階にわたってマウス筋芽細胞系列に由来する4億3,000万個以上の75 bpのペアエンドRNA-Seq読み取り配列を解読して分析した。その結果、既知転写物13,692個、およびこれまでにアノテーションされていない転写物3,724個が検出され、そのうち62%は、独立した発現データ、または別の種の相同遺伝子によって支持された。時系列でみると、優勢な転写開始部位(TSS)の完全な切り替えまたはスプライス・アイソフォームが330個の遺伝子で認められ、それ以外の1,304個の遺伝子にもわずかな変化が認められた。今回の結果は、Cufflinksにより、この研究の進んでいる筋発生モデルでも調節に関する柔軟性および複雑性が十分に明らかにされ、トランスクリプトームに基づくゲノムアノテーションが改善されることを示唆している。

目次へ戻る

プライバシーマーク制度