News

ディープラーニングで細胞や遺伝子を詳細に分析

眼底画像を解析して、心臓発作が迫っていることを予測できるという。 Credit: V. Bergman/CORBIS/Corbis via Getty Images

目は心の窓だとよくいわれる。しかし、グーグル社(米国カリフォルニア州マウンテンビュー)の研究者たちは、目をヒトの健康の表示器だと考えている。この技術系分野の最大手企業は、ディープラーニング(深層学習)を使用して目の網膜の写真を解析し、その人の血圧、年齢、喫煙状態を予測する研究を進めている。グーグルのコンピューターは血管の配置から手掛かりを集めている。予備的な研究で、この情報をコンピューターで解析することにより、ある人がごく近いうちに心臓発作を起こすリスクがあるかどうかを予測できることが示唆された。

この研究を助けているのは畳み込みニューラルネットワークと呼ばれるもので、ディープラーニングアルゴリズムの一種だ。これによって生物学者が画像を解析するやり方が変わり始めている。科学者たちはこのアプローチを使用して、ゲノム中の変異を発見し、単一細胞内の配置における変化を予測している。2017年8月にプレプリントサーバーに投稿された論文(R. Poplin et al. Preprint at https://arxiv.org/abs/1708.09843)で説明されたグーグルのアプローチは、画像処理をより簡単にし、もっと多様な用途に使用できる新しいディープラーニングアプリケーションの波の一環であり、これまで見落とされてきた生物学的現象を特定することさえできる可能性がある。

「これまでは、生物学の多くの領域に機械学習を適用することは、現実的ではありませんでした」と、グーグルリサーチ(米国カリフォルニア州マウンテンビュー)の工学部長Philip Nelsonは言う。「それが可能になったのです。それどころか、コンピューターは今、人間がこれまで見たことがなかったものまで見ることができるのです」。

畳み込みニューラルネットワークにより、コンピューターは画像をたくさんのパーツに分割しなくても、効率的かつ全体的に画像を処理できる。このアプローチは2012年ごろにコンピューターの処理能力と記憶装置の進歩によって技術部門で使われ始めた。例えば、フェイスブックは、このタイプのディープラーニングを使用して、写真の中の顔を特定している。しかし、科学者たちは、分野間の文化の違いもあって、ネットワークを生物学に適用するのに苦労していた。「聡明な生物学者のグループと、聡明なコンピューター科学者のグループを同じ部屋に入れたら、彼らは2つの異なる言語を使って対話し、異なった物の見方をするだろう」と、グーグルの親会社アルファベットの傘下にあるバイオ企業キャリコ(米国カリフォルニア州サンフランシスコ)の最高コンピューター責任者Daphne Kollerは述べる。

また、科学者たちは、どのタイプの研究にネットワークを使用できるかも特定しなければならなかった。こうしたネットワークは、予測を始められるようになる前に、まず膨大なセットの画像を使って訓練しなければならない。グーグルがディープラーニングを使用してゲノム中に変異を見つけようとしていたとき、グーグルの科学者たちはDNA文字の鎖をコンピューターが認識できる画像に変換しなければならなかった。そして次に、既知の変異を持つDNA断片を参照ゲノムと並べたものを使って、ネットワークを訓練した。その結果生まれたのが2017年12月にリリースされたDeepVariantと呼ばれるツールで、これを使えばDNA塩基配列の小さな変化も見つけることができる。試験では、DeepVariantは少なくとも従来のツール並みの性能を見せた。

アレン細胞科学研究所(米国ワシントン州シアトル)の細胞生物学者たちは、畳み込みニューラルネットワークを使用して、光学顕微鏡でキャプチャされた平坦で灰色の細胞の画像を、細胞小器官の一部が色で標識された3Dイメージに変換している。このアプローチにより細胞を染色する必要がなくなる。染色には多くの時間がかかる上に高性能の研究室が必要であり、細胞を損傷しかねない。この研究チームは2017年12月、さらに進んだ技術について、詳細をプレプリントサーバーbioRxivに投稿した。この技術では、細胞の輪郭などのわずかなデータを使うだけで、より多くの細胞小器官の形や場所を予測できる(G. R. Johnson et al. Preprint at bioRxiv http://doi.org/chwv)。

「機械学習が画像に関連する生物学的タスクをどれくらいうまく達成できるかにおいて、今、空前の転換が見られています」と、マサチューセッツ工科大学(MIT)とハーバード大学のブロード研究所(ともに米国マサチューセッツ州ケンブリッジ)のイメージング・プラットフォームのディレクターを務めるAnne Carpenterは言う。彼女の学際的研究チームは、2015年に畳み込みニューラルネットワークを使用した細胞の画像処理を始めた。現在、彼女のセンターでは画像データの約15%がネットワークによって処理されているとCarpenterは言う。彼女は、数年後にはこのアプローチがセンターの画像処理方式で主流になるだろうと予測する。

畳み込みニューラルネットワークを使って画像を解析することで、捉えにくい生物学的現象が偶然に明らかにされるかもしれない。そうなれば、生物学者たちがこれまで考えたこともなかった疑問が解明されていくだろう。この可能性に非常に興奮している人々もいる。「科学において、最も興味深いのは『分かったぞ!』ではなく、『こいつは変だな。一体どうなっているのだろう』というフレーズでしょう?」とNelsonは言う。

そのような思わぬ発見は、疾病研究の進歩を助けるかもしれないと、アレン研究所の最高責任者のRick Horwitzは言う。彼は、もしもディープラーニングによって、捉えにくいがんのマーカーを個別の細胞で明らかにすることができれば、腫瘍の進行の分類の仕方を改善する助けになるかもしれないと言う。それが次に、がんがどう広がっていくかに関する新しい仮説を引き出すきっかけになるかもしれない。

畳み込みニューラルネットワークが画像処理に使われるようになってきたので、生物学における他の機械学習の権威たちは、新たな最先端領域に焦点を合わせている。「画像化は重要ですが、化学や分子データも負けず劣らず重要です」と、GSF国立環境・健康研究センター(ドイツ・ノイヘルベルク)のコンピューター科学者Alex Wolfは述べる。Wolfは、ニューラルネットワークに手を加えて、遺伝子発現を解析できるようにしたいと考えている。「私は、これから数年後に非常に大きなブレークスルーがあると思っています。それによって生物学者たちはニューラルネットワークをもっと広く適用できるようになるでしょう」と彼は言う。

翻訳:古川奈々子

Nature ダイジェスト Vol. 15 No. 4

DOI: 10.1038/ndigest.2018.180415

原文

Deep learning sharpens views of cells and genes
  • Nature (2018-01-04) | DOI: 10.1038/d41586-018-00004-w
  • Amy Maxmen