機械学習で脳腫瘍を分類
病気を適切に治療するためには、正確な診断が不可欠である。今日、脳腫瘍の診断に使われている主な技術は、組織学的評価と呼ばれるもので、スライドガラスに載せた腫瘍検体を顕微鏡で観察する方法だ。しかし、これには細胞の微妙な変化の評価が必要とされ、一部の症例では、同じ検体でも検査者によって異なる分類がなされる場合がある。最近では、技術の進歩によって膨大な量の分子データが得られるようになり、そうしたデータを使うことで、組織学的評価のような主観的な診断法を必要とせずに腫瘍を評価できる。そうしたことから、臨床検体の診断を助けるための、機械学習による評価手法の開発が進められている。このほど、ハイデルベルク大学病院(ドイツ)およびドイツがん研究センター(ハイデルベルク)に所属するDavid Capperら1は、脳腫瘍を分子パターンに基づいて分類する機械学習アルゴリズムを使って評価する方法の1つをNature 3月22日号469ページで報告した。
1926年にPercival BaileyとHarvey Cushingが発表した、『A Classification of the Tumors of the Glioma Group on a Histo-Genetic Basis with a Correlated Study of Prognosis』(組織遺伝学に基づくグリオーマグループの腫瘍の分類と予後の関連研究)という書籍2は、グリオーマの発生、細胞特性、および臨床結果について初期の手掛かりをもたらした。グリオーマとは中枢神経系(CNS)のがんの一種である。BaileyとCushingが主張した顕微鏡による診断法が当時は一般的ではなかったことを考えれば、この本のタイトルは予言的かつ野心的だった。彼らの考えは時代に先んじていたのである。例えば、書名に含まれる「histo-genetic(組織遺伝学)」という言葉は、細胞の変化と遺伝との関連を示している。BaileyとCushingは詳細への執拗なこだわりにより、臨床結果と相関する腫瘍のマクロとミクロの特徴を明らかにすることができた。そしてこの本では、14タイプの腫瘍の分類が報告されている。
今日、多くの脳腫瘍が組織学的特徴と分子レベルの特徴の両方を分析することにより特定されている3-5。生物学的な意味があって、腫瘍タイプを定義でき、臨床的に有用な脳腫瘍の遺伝的変化が特定されるようになったこと6,7に促され、世界保健機関(WHO)は2016年に特定の脳腫瘍についての診断ガイドラインを改訂して、組織学と分子情報の両方を合わせた統合的な診断アプローチを推奨するようになった8,9。しかし、多くのタイプの稀な腫瘍については、分子識別子がないために、組織学を主に用いた診断が今でも一般的である。しかし、組織学的診断は多くの難題に直面している。例えば、異なった遺伝的変化を持つ細胞をモザイク状に含む腫瘍では、細胞ごとに変動が見られる可能性がある。また、多くの異なったタイプの脳腫瘍がよく似た組織学的特徴を共有している場合もある。組織学的な類似性がどの程度、腫瘍の類似性を反映するのかという疑問も残っている。同様の組織学的所見を持つ腫瘍が、異なったやり方で進行することがある一方、組織学的には違いが明白な腫瘍が、同じような進行過程を示す場合があるからだ。
組織学的分析における主要な進歩の1つは、機械学習プロセスにより組織学的データを分析できるコンピューターツールが増えてきたことである10,11。このアプローチでは、医師によって分類された腫瘍検体画像のデータセットを使用してコンピューターを「訓練」する。するとコンピューターは、その分類情報を使って、自身の認識基準を作り出し、それによって腫瘍タイプを特定する。しかし、ある腫瘍に明確に定義された診断基準がない場合、あるいは異なるタイプの腫瘍を組織学的に識別できない場合には、問題が生じる。
Capperらは、分類に複雑な視覚的評価を必要としない分子情報に焦点を合わせることにした。彼らはDNAメチル化(DNAへのメチル基の付加)の変化に基づいた腫瘍分類を行う機械学習アルゴリズムを開発し、このアルゴリズムを使った評価法による分類と、組織学的分析を使用して病理学者が行った分類とを比較した。
DNAメチル化は、エピジェネティックな変化として知られているDNA修飾の一種である。このような種類の変更は、DNA塩基配列を変えることはないが、遺伝子発現や細胞の運命に影響を与えることがある。がんにおいては、異常なDNAメチル化などのエピジェネティックな変化の役割がますます明白になってきている12,13。多くのがんでは、エピジェネティックなパターン(エピゲノムと呼ばれる)がゲノム全体において大幅に変化している場合がある。例えば、グリオーマにおける遺伝子IDH1もしくはIDH2の変異は、DNAメチル化パターンの調節不全をゲノム全体に引き起こし、これが特定の臨床転帰と関連している可能性がある12。
以前の研究14-16で、あるタイプの脳腫瘍ではDNAメチル化プロファイリングに診断上の利点があることがはっきりと示された。組織学的検査や特定の遺伝子の変化を調べることと比較して、DNAメチル化のエピゲノム全体の分析は偏りのない診断アプローチとなるからだ。しかし、臨床診断でエピゲノム全体のメチル化プロファイリングが日常的に行われることは比較的珍しい。コスト面や検体の条件、必要なデータ分析技術を持つ人材の不足、そして、得られた所見が臨床治療に生かせるほど重要かどうかが分からないという問題などがその理由だ。しかし、いくらかの前進が見られている。例えば、最も一般的なタイプの腫瘍組織標本は、スライドガラス上に化学処理によって保存された「ホルマリン固定パラフィン包埋(FFPE)標本」と呼ばれるものだが、このFFPE標本から抽出されたDNAを使う技術が現在利用できるようになっている。
Capperらは、WHOによって分類されたほとんど全てのCNS腫瘍タイプの検体について、ゲノム全体のメチル化データをコンピューターに入力した。コンピューターは、病理学者が分類した検体に存在するメチル化パターンを認識するために教師付き機械学習を使用するとともに、教師なし機械学習も用いた。教師なし機械学習では、コンピューターはデータセットをサーチして、自身で作り出した分類カテゴリに検体を割り当てるために使用できるパターンを探し出す。
訓練後に、コンピューターは特定のメチル化プロファイルに基づいて腫瘍を82の異なるクラスに分類することができた。WHOによって定義された特定の腫瘍タイプに対応していたのはこれらのうちの29のみで、別の29はWHOによって定義された腫瘍タイプのサブクラスを表した。
しかし、Capperらによる発見の中で最も興味深いと思われるのは、WHOによって分類された腫瘍タイプを2つ以上含む、組織学的に類似したタイプの腫瘍をひとまとめにした腫瘍分類、あるいはWHOのグループ分けにマッチしていない腫瘍タイプの分類だろう。そのような発見は、腫瘍組織学から独立した腫瘍の類似性に関する洞察を提供するものであり、治療法の選択肢や診断用ツールの開発を助けるかもしれない。
Capperらは、コンピューターを使用して1104の腫瘍試験症例を分類した。これらの腫瘍は、標準的な組織学的または分子学的な技術を使って病理学者によりすでに診断が下されているものだ(図1)。これらの試験症例の60.4%は、コンピューターによる分類と病理学者の分類が一致した。そして、試験症例の15.5%については、コンピューターと病理学者は同じタイプの腫瘍としただけでなく、コンピューターはさらに腫瘍をサブクラスに分類することもできた。試験症例の12.6%では、コンピューター診断は病理学者の診断と一致しなかった。意外にも、これらの症例を遺伝子塩基配列解読などによりさらに厳密に分析したところ、診断が一致しなかった腫瘍の92.8%は、当初の臨床診断からコンピューターベースの分類へと切り換えられる結果となった。さらに、分類し直された腫瘍の71%は腫瘍グレードも異なっていた。このような再分類は予後や治療に重要かもしれない。残り試験症例(11.5%)はコンピューターでは分類できなかった。さらなるコンピューター解析で、このグループの腫瘍の3分の1が、コンピューターがまだ十分な数の検体に遭遇していないために分類のグループを作ることができていない、稀な腫瘍である可能性が示された。
Capperらの評価手法には、1検体当たりのコストが低いこと(標準のがん診断手法のコストと同程度)、一般に利用可能なFFPE標本を使用できること、そしてデータ入力、分析、および腫瘍分類を容易にするウェブサイトがあることなどの利点がある。それらを鑑みて、この手法が将来、腫瘍診断の標準的な方法となり得ると考えていいのだろうか? そして、もしそうだとすれば、組織学的分析は廃れてしまうのだろうか?
腫瘍検体の包括的な分子プロファイルを得ることは、確かに有用であり、顕微鏡検査と合わせた場合には特にそうだ。それに、個人の腫瘍の特性に基づいてさらに医療が個別化されるようになるにつれ、こうしたやり方がもっと進んでいくかもしれない。しかし、当面は、標本として保存して顕微鏡法による検査を行うという標準的手法は、世界中の臨床検査室で使用される日常的な診断作業の流れにおいて最も利用しやすい普遍的な入り口であるため、組織学的検査は疾患分類にとって不可欠なものであり続けるだろう。疾患は、分子の変化および細胞の変化の両方の形で現れる可能性がある。従って、分子解析と視覚的検査の両方を統合する手法によって、診断能力が強化されるかもしれない。
Capperらによって開発されたプラットフォームを日常的かつ広範囲に使用することは、現段階においては、多くの検査室にとって実用的でないかもしれない。この技術がすぐに使われる可能性が高いのは例えば、組織学的特徴が曖昧な症例を評価する場合だろう。とはいえ、Capperらの評価手法は、顕微鏡検査の腫瘍診断能力を補足、拡大するものであり、一部の症例では顕微鏡組織診断に取って代わる可能性もある。
翻訳:古川奈々子
Nature ダイジェスト Vol. 15 No. 6
DOI: 10.1038/ndigest.2018.180637
原文
Machine learning classifies cancer- Nature (2018-03-22) | DOI: 10.1038/d41586-018-02881-7
- Derek Wong & Stephen Yip
- Derek Wong & Stephen Yipは、ブリティッシュ・コロンビア大学(カナダ・バンクーバー)病理学・臨床検査部門に所属。
参考文献
- Capper, D. et al. Nature 555, 469–474 (2018).
- Bailey, P. & Cushing, H. A Classification of the Tumors of the Glioma Group on a Histo-Genetic Basis with a Correlated Study of Prognosis (Lippincott, 1926).
- Cancer Genome Atlas Research Network. N. Engl. J. Med. 372, 2481–2498 (2015).
- Eckel-Passow, J. E. et al. N. Engl. J. Med. 372, 2499–2508 (2015).
- Sturm, D. et al. Cell 164, 1060–1072 (2016).
- Yan, H. et al. N. Engl. J. Med. 360, 765–773 (2009).
- Sturm, D. et al. Cancer Cell 22, 425–437 (2012).
- Louis, D. N., Ohgaki, H., Wiestler, O. D. & Cavenee, W. K. (eds) WHO Classification of Tumours of the Central Nervous System 4th edn (International Agency For Research on Cancer, 2016).
- Aldape, K., Nejad, R., Louis, D. N. & Zadeh, G. Neuro Oncol. 19, 336–344 (2017).
- Kleppe, A. et al. Lancet Oncol. 19, 356–369 (2018).
- Ehteshami Bejnordi, B. et al. J. Am. Med. Assoc. 318, 2199–2210 (2017).
- Turcan, S. et al. Nature 483, 479–483 (2012).
- Schwartzentruber, J. et al. Nature 482, 226–231 (2012).
- Wiestler, B. et al. Acta Neuropathol. 128, 561–571 (2014).
- Sahm, F. et al. Lancet Oncol. 18, 682–694 (2017).
- Korshunov, A. et al. Acta Neuropathol. 134, 965–967 (2017).