Article

診断マーカー:分散型で機密性の高い臨床用機械学習のための群れ学習

Nature 594, 7862 doi: 10.1038/s41586-021-03583-3

重篤で不均一な疾患の患者を迅速かつ正確に検出することは、プレシジョン・メディシンの重要な目標である。白血病患者は、血液トランスクリプトームに基づいた機械学習を用いて識別することができる。しかし、プライバシーに関する法規制のために、技術的に可能なことと実際に許可されていることの間の隔たりは広がりつつある。今回我々は、プライバシー法に抵触することなく世界中のデータ保持者から得たあらゆる医療データの統合を容易にするために、「群れ学習(Swarm Learning)」を開発した。これは分散型の機械学習法であり、エッジコンピューティングとブロックチェーンによるピアツーピアのネットワーク化と管理を組み合わせる一方、中央管理者を必要とせずに機密性を維持しており、連合学習よりも優れている。分散データを用いた群れ学習による疾患分類法開発の実現可能性を例示するために、我々は使用事例として4つの不均一疾患[新型コロナウイルス感染症(COVID-19)、結核、白血病、肺疾患]を選択した。症例と対照群の分布が不均一でかなりの研究の偏りがある、127件の臨床研究で得られた1万6400以上の血液トランスクリプトームと、9万5000枚以上の胸部X線画像を用いたところ、群れ学習分類子の性能が、個々のサイトで開発されたものよりも優れていることが示された。さらに、群れ学習は設計上、地域の機密保持規制を完全に遵守している。我々は、この手法によってプレシジョン・メディシンの導入が著しく加速されると考える。

目次へ戻る

プライバシーマーク制度