Article

反復グラフを用いる誤りの多いロングリードのアセンブリー

Nature Biotechnology 37, 5 doi: 10.1038/s41587-019-0072-8

正確なゲノムアセンブリーは、反復領域によって妨げられる。ロングリードの単一分子塩基配列解読は、ゲノム中の反復の解読に関してショートリードのデータよりも優れているが、大多数のロングリードアセンブリー用アルゴリズムでは、最適なアセンブリーを得るために必要な反復の特性解析が行われない。本論文では、ロングリードアセンブリー用のアルゴリズムFlyeを紹介する。これは、未知の反復グラフ中に「ディスジョインティグ(disjointig)」という任意の経路を生成し、誤りの多いこれらのディスジョインティグから正確な反復グラフを構築するものである。Flyeを最先端のアセンブラー5種に照らして評価した結果、Flyeは得られるアセンブリーの質が同等かそれ以上でありながら、1桁高速であることが明らかになった。アセンブリーの質の指標であるNGA50で評価したところ、ヒトゲノムアセンブリーの連続性は既存のアセンブラーのほぼ2倍であった。

目次へ戻る

プライバシーマーク制度