Technical Report

次世代シーケンサー:次世代DNA塩基配列決定データを用いた遺伝的変動発見および遺伝子型同定の
ためのフレームワーク

Nature Genetics 43, 5 doi: 10.1038/ng.806

近年の塩基配列決定技術の進歩は集団サンプル内の遺伝的変動を包括的にカタログ化することを可能にした。このことは、ヒトの疾患、家系、進化を理解するための基礎を構築するものである。シーケンサーから出力されるデータ量は膨大なもので、その出力を高品質のバリアントのコールに変換するには、多くのステップのコンピューター処理が必要である。今回、私たちは複数のサンプル間で同時にバリアントを発見し、遺伝子型同定するための統合的な解析フレームワークを提示する。これを用いることで、5つの塩基配列決定技術およびそして3つの異なる標準的な実験デザインにわたって、感度と特異度のある結果を得られるに至った。我々の処理は以下のようなものである。(i)リード配列のマッピング、
(ii)局所的な塩基挿入/欠失付近の再アライメント、(iii)塩基の品質スコアの再計算、(iv)次世代DNA塩基配列決定技術に共通の機器のアーティファクト(エラー)により生じる除去すべきバリアントを分けるための機械学習。本報告では、ゲノム解析ツールキットを例に、全ゲノムの大量塩基配列決定、全エキソン配列決定、および1000ゲノムプロジェクトデータセット中の複数サンプルにおける低い塩基配列決定深度(およそ4倍)の塩基配列決定に対してのツールの適用についても議論している。

目次へ戻る

プライバシーマーク制度