Article

一分子配列解読リードの複合的なエラー修正および新規組み立て

Nature Biotechnology 30, 7 doi: 10.1038/nbt.2280

一分子配列解読装置は何千塩基もの配列を得ることができ、ゲノムおよびトランスクリプトームの組み立てを大幅に改善させる可能性がある。しかし、一分子リードはエラー率が高いため、これまでその用途は細菌の配列再解読に限定されていた。この限界を打破するため、我々は、短く忠実度の高い配列を用いて一分子配列のエラーを修正する修正アルゴリズムおよび組み立て戦略を導入した。本研究ではPacBio RS装置を用い、配列未解読のセキセイインコ(Melopsittacus undulates)のゲノムなど、ファージ、原核生物、および真核生物の全ゲノムのリードとともに、トウモロコシ(Zea mays)のトランスクリプトームのRNA-Seqリードでこの方法の有用性を確認した。我々の長いリードの修正は99.9%超のベースコール精度を達成し、従来の配列解読戦略と比較してはるかに優れたアセンブリーとなった。最高の例では、コンティグサイズの中央値が高カバー率の第二世代アセンブリーの5倍であった。リード長が伸長すれば、単一コンティグの細菌染色体アセンブリーが視野に入るなど、一層の収穫が予測される。

目次へ戻る

プライバシーマーク制度