Article

正確な循環コンセンサスロングリード塩基配列解読法がバリアントの検出およびヒトゲノムのアセンブリーを改善する

Nature Biotechnology 37, 10 doi: 10.1038/s41587-019-0217-9

現在利用されているDNA配列解読技術で得られるのは、極めて正確なショートリードまたは正確度の劣るロングリードのいずれかである。本論文では、単一分子リアルタイム(SMRT)塩基配列解読法(PacBio)の正確度を向上させて平均長13.5キロ塩基(kb)の極めて正確で(99.8%)忠実度が高い(HiFi)ロングリードを得る循環コンセンサス塩基配列解読法(CCS)の最適化について記す。特徴が十分に知られているヒトHG002/NA24385ゲノムの塩基配列解読をこの方法で行ったところ、精度およびリコール率は一塩基バリアント(SNV)で99.91%以上、50 bp未満の挿入および欠失(インデル)で95.98%以上、構造バリアントで95.99%以上となった。このCCS法の能力は、小バリアントおよび構造バリアントを検出するショートリード塩基配列解読法と同等またはそれ以上である。2434件の不一致は「ゲノム・イン・ア・ボトル(GIAB)」ベンチマークセット内の修正可能な誤りであると推定された。ほとんど全て(99.64%)のバリアントはハプロタイプフェージングが可能であり、バリアントの検出がさらに改善された。CCSリードのみを用いたde novo ゲノムアセンブリーでは、コンティグN50が15メガ塩基(Mb)以上で一致率が99.997%の連続した正確なゲノムが得られ、正確度の劣るロングリードによるアセンブリーよりも大幅に優れていた。

目次へ戻る

プライバシーマーク制度