Letter

タンデム質量スペクトルのライブラリから学習する機械を使用した強度に基づくタンパク質同定

Nature Biotechnology 22, 2 doi: 10.1038/nbt930

タンデム質量分析法(MS/MS)がプロテオミクスの基盤として認められるものになった理由のひとつに、強力なスペクトル解釈アルゴリズムがある。広く用いられているアルゴリズムは質量スペクトルの強度パターンを十分に活用しきれていない。本論文では、MS/MSスペクトルからのペプチドおよびタンパク質同定が強度パターンのモデル化によって進展することを示す。フラグメントイオン強度のモデル化には、観測した強度に所与のペプチドおよびフラグメントが寄与する尤度を推定する機械学習という方法を利用した。トレーニングデータとして、スペクトル1,000,000本のなかから良質で重複のないマッチ27,000本を選択した。このスペクトル27,000本を使い、ミスマッチのペプチドの強度も同様にモデル化した。候補ペプチドがマッチまたはミスマッチである場合、この2種類の確率モデルを使って、観測したスペクトルの相対尤度を計算した。正しくないマッチの頻度を「デコイ(おとり)」プロテオーム法で推定すると、強度に基づく方法ではペプチド同定の誤りが50〜96%減少し、感度が低下しないことが示された。

目次へ戻る

プライバシーマーク制度