Article

WENGANによるヒトゲノムの効率的な複合de novoアセンブリー

Nature Biotechnology 39, 4 doi: 10.1038/s41587-020-00747-w

誤りの多いロングリードのみを用いて大型で反復の多いヒトゲノムの正確なゲノムアセンブリーを行うのは困難であることが知られており、ロングリードからアセンブリーが行われたヒトゲノムの多くは正確なショートリードを加えてコンセンサス配列を仕上げている。今回我々は、低い計算コストで極めて高い質を実現する複合型のアセンブリーアルゴリズムWENGANを紹介する。我々は、ONT PromethION、PacBio Sequel、Illumina、MGIの各技術で得られた塩基配列解読データを組み合わせて4セットのヒトゲノムのde novoアセンブリーを実際に行った。WENGANは効率的なアルゴリズムを実行し、アセンブリーの連続性と共にコンセンサス配列の質を向上させる。得られたゲノムアセンブリーは、連続性が高く(コンティグNG50:17.24~80.64 Mb)、アセンブリーエラーが少なく(コンティグNGA50:11.8~59.59 Mb)、コンセンサス配列の質が優れ(QV:27.84~42.88)、遺伝子の完全性が高い(BUSCO完全性:94.6~95.2%)が、計算資源の消費は低水準であった(CPU時間:187~1200時間)。特に、ハプロイドCHM13試料のWENGANによるアセンブリーでは80.64 MbというコンティグNG50が得られ(NGA50:59.59 Mb)、現在のヒト参照ゲノムの連続性(GRCh38のコンティグNG50:57.88 Mb)を上回った。

目次へ戻る

プライバシーマーク制度