Article

スペクトルライブラリーに存在しない代謝物の高信頼度の構造アノテーション

Nature Biotechnology 40, 3 doi: 10.1038/s41587-021-01045-9

非選択的なメタボロミクス実験は構造アノテーションをスペクトルライブラリーに依存するが、一般にごく一部のスペクトルしか一致が得られない。従来のin silico法は構造データベースを検索するが、アノテーションの正誤を見分けることはできない。本論文では、in silicoの構造データベースの作成とアノテーションに、カーネル密度P値推定からなる信頼度スコアと特徴の方向性を強制したサポートベクターマシンを組み合わせた、COSMICワークフローを紹介する。COSMICは、さまざまなデータセットで多数のヒットのアノテーションを低い偽発見率で行い、スペクトルライブラリー検索を超える性能を示した。我々は、以前に報告されたことのない構造がCOSMICでアノテーションできることを実証するため、12種類の天然の胆汁酸のアノテーションを行った。9つの構造のアノテーションは手作業による評価で、2つの構造のアノテーションは合成標準を用いて、それぞれ確認された。ヒト試料では、現在ヒトメタボロームデータベースに存在しない315種類の分子構造のアノテーションと手作業による検証を行った。COSMICを1万7400件のメタボロミクス実験のデータに応用したところ、スペクトルライブラリーに存在しなかった高信頼度の構造アノテーションが1715点得られた。

目次へ戻る

プライバシーマーク制度