Editorial

AlphaFoldの潜在能力を最大限引き出すには

生命科学に大変革をもたらしたAlphaFold。こうしたAIツールのさらなる発展には、業界全体がEMBL-EBIのようなオープンリポジトリでデータを共有していく必要がある。 Credit: CHRISTOPH BURGSTEDT/SCIENCE PHOTO LIBRARY9/Getty

「私は、朝起きると、ツイッターにAlphaFoldと打ち込みます」。Nature 2022年4月14日号のNews Feature(234~238ページ)に登場したジョン・ジャンパー(John Jumper)は興奮を抑えられない様子で話していた。この記事の中で、ジャンパーは、遺伝子配列からタンパク質の三次元形状を予測できるソフトウエアAlphaFoldが生物学をどのように変えているかを説明している(2022年7月号「タンパク質構造予測AIによる革命と『その先』」参照)。ジャンパーは、Google傘下のディープマインド(DeepMind;英国ロンドン)で、AlphaFoldを開発したチームを率いている。ディープマインド社は、同社の研究者がAlphaFoldを使って、100万以上の生物種に由来する2億1400万種のタンパク質(基本的に既知のタンパク質コード配列の全て)の構造予測を行ったことを2022年7月28日に発表した(Nature 2022年8月4日号15ページ参照)。

AlphaFoldは、ここ数十年間の生命科学の分野で最もエキサイティングな開発成果の1つであることは明らかだ(15ページ「AlphaFoldの開発者らに300万ドルのブレークスルー賞」参照)。2022年7月の終わりまでに、190カ国の50万人以上の研究者が、2021年7月以降にディープマインド社が公開した200万点以上のタンパク質構造にアクセスした。これらのタンパク質構造は、英国ケンブリッジ近郊にある欧州分子生物学研究所の欧州バイオインフォマティクス研究所(EMBL-EBI)とディープマインド社が共同管理しているオープンデータベースに登録されている。EMBL-EBIは、生物学データを公共財として維持することに全力で取り組む政府間組織である。このデータベースは、既に1000編以上の研究論文で引用されている。

人工知能(AI)は、生命科学の世界に定着しつつある。しかし、この技術によって得られた識見を検証し、発展させるためには、各研究機関が理論、実験、計算論の各分野間に密接な協力関係を確立する必要がある。

また、ディープマインド以外の企業は、この機会を捉えて、EMBL-EBIが維持管理しているオープンリポジトリやその他のオープンリポジトリとの連携に全力を尽くす必要がある。そうした企業が保有するデータとソフトウエアは、誰でも無料で利用できるようにして、次世代AIツールの開発を可能にする必要がある。

各企業はオープンリポジトリと連携して、保有データのオープン化に力を尽くす必要がある

この1年間、科学者たちは、AlphaFoldをさまざまな形で応用してきた。AlphaFoldの予測結果を使って新しいタンパク質ファミリーの存在を明らかにした研究者(今度は、その存在を実験的に検証する必要がある)や、顧みられない病気の治療薬の探索に役立てている研究者もいる。また、海洋水や下水から試料を採取して遺伝子配列を調べた研究者もいる。この研究では、AlphaFoldを使って試料中の遺伝子配列からタンパク質の構造を予測し、プラスチック分解能を有する可能性のある酵素を見つけ出すことを目的としている。

ディープマインド社は、自らツールを開発するだけでなく、構造生物学の変革に重要な役割を果たす方針決定も行った。例えば2021年7月には、AlphaFoldのコードをオープンソース化して、誰もがAlphaFoldを使えるようにし、2022年1月には、AlphaFoldの商用利用の一部に対する制限を撤廃した。

またディープマインド社は、EMBL-EBIと共同で維持管理しているAlphaFoldデータベースの構築に助力し、財政支援を行っている。同社の最高経営責任者であるデミス・ハサビス(Demis Hassabis)とそのチーム、および外部協力者による、このようなオープンサイエンスへの取り組みは称賛に値する。

同社は、2022年7月に生物医学の主力研究機関であるフランシス・クリック研究所(英国ロンドン)内に研究室を設立することを発表した。これもまた歓迎すべき動きであり、計算論的方法を専門とする研究者と、実践的なツールを使って作業をすることの方が多い研究者との間に求められる密接なパートナーシップを構築し、強化する上で役立つことだろう。

AlphaFoldは、それ自体に限界があり、そのことは設計者も十分に認識している。例えばAlphaFoldは、疾患を引き起こす変異によってタンパク質の形状がどのように変化するかを予測するようには設計されていない。それに、他のタンパク質との相互作用によるタンパク質の形状変化を予測することを目的としたものでもなかった(ただし、この次世代への課題については、研究に進展が見られる)。また、AlphaFoldの予測から創薬に必要な詳細情報が確実に得られるのかどうかも明らかでない。そうした情報の一例が、小型分子が結合するかもしれないタンパク質上の領域の正確な形状であり、医薬品開発で渇望されている。

ハサビスは、2022年7月28日の記者会見において、AlphaFoldの登場で「発想の大転換が必要になる」と述べた。AlphaFoldの利用方法を見つけ、AlphaFoldがもたらす手掛かりを基に研究の発展を目指している研究者の間では、発想の大転換が起こり始めている。

しかし、発想の大転換には、もっと多くの企業と研究者を巻き込まなければならない。そして、オープンデータ化とオープンソースソフトウエア化に真剣に取り組まなければならない。未来のアプリケーションの開発は、現代のAIツールの場合と全く同じように、さまざまなリポジトリでテラバイト規模の研究データを一般公開してソフトウエア開発に役立てられるかどうかにかかっている。

翻訳:菊川要

Nature ダイジェスト Vol. 19 No. 11

DOI: 10.1038/ndigest.2022.221105

原文

How AlphaFold can realize AI’s full potential in structural biology
  • Nature (2022-08-02) | DOI: 10.1038/d41586-022-02088-x