注目の論文

機械学習:新型コロナウイルス感染症による死亡と関連する3つのバイオマーカーをモデルが特定

Nature Machine Intelligence

2020年5月15日

Machine learning: Model identifies three biomarkers associated with COVID-19 mortality

機械学習ツールが、中国・武漢の新型コロナウイルス感染症(COVID-19)患者485人から採取した血液検体を利用して、COVID-19による死亡を予測できるバイオマーカーを3つ選び出したという報告が、Nature Machine Intelligence に掲載される。乳酸脱水素酵素(LDH)、リンパ球、高感度C反応性タンパク質(hs-CRP)という3つのバイオマーカーは、個々の患者の死亡を、その転帰の10日以上前に、90%以上の精度で予測することができた。

COVID-19患者の重症度を早い段階で迅速かつ正確に臨床評価することは極めて重要である。しかし、直ちに治療を必要とする患者を見分け、COVID-19に関連した死亡率を見積もるための予測バイオマーカーは現時点では存在しない。

今回、Ye Yuan、Li Yanらは、中国・武漢のCOVID-19患者485人の血液検体を分析し、死亡リスクを予測するロバストで意味のあるマーカーを突き止めた。モデル開発に使用した検体は、2020年1月10日から2月18日までに同済病院の患者から採取したものである。検体が分析に用いられた375人の患者のうち、201人はCOVID-19から回復して退院したが、残りの174人は死亡した。

著者たちは、患者の死亡を最も正確に予測できるバイオマーカーを特定するために考案された機械学習アルゴリズムに基づいて、数学的モデル化アプローチを設計した。問題は分類課題として定式化され、一般患者、重症患者、重体患者の基本情報、症状、血液検体の他、肝機能、腎機能、凝固機能、電解質、炎症因子などの臨床検査の結果が入力された。切迫したリスクのある患者を識別するための最も重要なバイオマーカーとしてモデルが選択したのは、乳酸脱水素酵素(LDH)、リンパ球、高感度C反応性タンパク質(hs-CRP)の3つだった。LDH濃度の高さについては、肺炎などの肺疾患を含むさまざまな疾患で起こる組織破壊と単独で関連していることが分かっていて、今回の発見は、この医学的知見と整合性がある。ほとんどの患者は、入院中に複数回血液検体を採取されていた。しかし、このモデルでは最後に採取した検体からのデータのみを使用した。それでも、このモデルは他の全ての血液検体に適用することができ、バイオマーカーの予測性能を見積もることができる。

著者らはこのモデルについて、患者の死亡リスクを正確かつ迅速に定量するための、簡便で、解釈可能で、直観的な臨床検査を提供するものであると結論付けている。著者らはまた、白血球の一種であるリンパ球が潜在的な治療標的となる可能性も示唆しており、このことは臨床研究によって裏付けられている。著者らはさらに、より多くのデータが入手可能になるにつれ、この手順を繰り返して、予想精度をさらに高める必要があるとも指摘している。

doi: 10.1038/s42256-020-0180-7

「注目の論文」一覧へ戻る

プライバシーマーク制度