News in Focus

AlphaFoldの最新版は創薬を後押し

AlphaFold3は、タンパク質、DNA、RNA、リガンドなどの分子からなる生体分子複合体の構造を予測する。 Credit: Isomorphic Labs

タンパク質の構造を予測する強力な人工知能(AI)ツール「AlphaFold2」が2021年に公開されて以来、科学者らはこのモデルを使って細胞内で最大級の分子装置の構造をマッピングしたり、薬物を発見したり、既知の全てのタンパク質の構造のデータベースを作成したりしてきた。

こうした成功にもかかわらず、グーグル・ディープマインド社(Google DeepMind、英国ロンドン)でAlphaFoldの開発チームを率いるJohn Jumperは折に触れて、もっと高度なことはできないのかと聞かれてきたという。そうした質問の1つに、タンパク質が機能を変化させる修飾を受けたときの形状を予測することはできないのか、というものがあった。タンパク質が機能する際にはDNAやRNAや他の細胞内分子と相互作用する必要があり、このときの構造を予測できないかというのだ。「私はこの質問をされるたびに、『AlphaFoldにはその機能はありません』と答えていました」とJumperは言う。「できれば彼らが抱えている問題を解決してあげたかったのですが」。

2024年5月8日にNature1で発表された最新版のAlphaFold3は、まさにこの目的のために開発された。科学者らはこれにより、タンパク質が他の分子と相互作用する際に取る構造を予測できるようになった。なお、AlphaFold2は無料で制限なく利用できたが、AlphaFold3は非商用利用に限られ、ディープマインド社のウェブサイトを通じてしか利用することができない。

AlphaFold3にいち早くアクセスしたフランシス・クリック研究所(英国ロンドン)の生化学者Frank Uhlmannは、その性能に感銘を受けたという。「まさしく革命的です」と彼は言う。「構造生物学研究を民主化することになるでしょう」。

2021年にAlphaFold2が公開されて以来2、多くの科学者が、このツールが生物学に及ぼした影響を「革命的」という言葉で表現してきた(Jumperによると、2020年に発表された最初のバージョンのAlphaFold23も悪くはなかったが、ゲームチェンジャーというほどではなかったという)。タンパク質のアミノ酸配列からその構造を予測するAlphaFold2は、しばしば実験的手法に匹敵する驚異的な精度を示した。

無料で利用できるAlphaFoldのデータベースには、既知のほぼ全てのタンパク質の構造予測データが保存されている。また、AlphaFold2のコードが公開されたことで、他の研究者らもこれを容易に利用できるようになった。例えば、AlphaFold2の発表から間もなく、研究者らはこれを利用して複数のタンパク質の間の相互作用を予測するようになり、この機能はAlphaFold2のアップデート版に実装された。

かつてJumperが、最初のバージョンのAlphaFoldではタンパク質が他の分子と相互作用して機能する際の構造を予測できないことをうんざりするほど説明させられたのは、これが重要であるからだ。タンパク質の修飾(例えばリン酸化)は、細胞が外部刺激(例えば感染症)に応答して一連の反応を引き起こすことを可能にする。また、DNAやRNAや他の化学物質との相互作用は、多くのタンパク質が機能する上で必須だ。

これらの相互作用の実例は、Protein Data Bank(PDB)で容易に入手することができる。PDBは実験により決定されたタンパク質構造のリポジトリで、AlphaFoldの能力の基盤となっている。タンパク質の構造を、その修飾分子と共に予測できるツールがあれば理想的だと、Jumperは言う。「私たちはPDB全体を解きたいのです」。

大幅なアップグレード

AlphaFold3を開発するため、Jumperとディープマインド社の最高経営責任者Demis Hassabisらは、前のバージョンを大きく変更した。例えば最新版では、標的配列に関連したタンパク質についての情報への依存が少なくなっている。AlphaFold3はまた、Midjourneyのような画像生成AIツールで使われている「拡散モデル」という機械学習ネットワークを使用している。Jumperは、「これは非常に大きな変更点です」と言う。

研究者らは、タンパク質とその相手分子の構造を予測するAlphaFold3の能力が、既存のソフトウエアツールより格段に優れていることを見いだした。例えば、科学者(中でも新薬の発見に関心を持つ科学者)らはこれまで、化学物質がタンパク質とどの程度よく結合するかを物理的にモデル化するために「ドッキング」ソフトを使用してきた(多くの場合、実験的に決定されたタンパク質構造を参考にしていた)。けれども今回、AlphaFold3は、2種類のドッキングプログラムの他、RoseTTAFold All-Atom4というAIベースのツールよりも優れていることが証明された。

Uhlmannの研究チームは、細胞分裂に不可欠なゲノムの複製に関わるDNA相互作用タンパク質の構造を、AlphaFold3を使って予測した。Uhlmannによると、タンパク質を変異させてその相互作用を変化させる実験を行ったところ、AlphaFold3の予測はたいてい的中していたという。「これは驚くべき発見ツールです」と彼は言う。

ワシントン大学(米国シアトル)の計算生物物理学者David Bakerも、「AlphaFold3の構造予測性能は圧倒的」だと言う。BakerのチームはRoseTTAFoldを開発したが、彼はAlphaFold3の方が優秀だと認めている。

アクセス制限

RoseTTAFoldやAlphaFold2とは異なり、AlphaFold3は科学者が独自のバージョンを走らせることはできないし、基礎となるコードや、モデルの訓練後に得られたその他の情報が公開されることもない。代わりに研究者らは「AlphaFold Server」にアクセスし、自分が調べたいタンパク質の配列と修飾分子を入力することになる。

Uhlmannは今のところこのサーバーの使用感を気に入っていて、自分の研究所で使っているバージョンのAlphaFold2よりも単純で迅速だと評価する。「アップロードして、10分後には構造が返ってくるのです」と彼は言う。「このサーバーは、ほとんどの科学者を満足させると思います。誰でも使いこなせるはずです」。

ただし、AlphaFold serverへのアクセスには制限がある。現時点では1日20件までしか予測させることができず、タンパク質が薬物候補と結合したときの構造を予測させることもできない。

ディープマインド社のスピンオフ企業であるアイソモルフィック・ラボ(Isomorphic Labs、英国ロンドン)は、自社のパイプラインと他の製薬会社との共同開発の両方で、AlphaFold3を創薬に役立てている。ディープマインド社のAI科学部門長で論文共著者のPushmeet Kohliは、「私たちはAlphaFold3を、多くの人が利用しやすく、科学界にインパクトを与えるものにすると同時に、アイソモルフィック社が商業的な創薬を追求する能力を損なうことがないように、バランスを取る必要があるのです」と弁解する。

カリフォルニア大学サンフランシスコ校(UCSF、米国)の製薬化学者で、AlphaFoldで予測した構造を使って薬物候補を探しているBrian Shoichetは、タンパク質と薬物候補との相互作用のモデル化に制限があるAlphaFold3がAlphaFold2以上のインパクトを与えることはないだろうと考えている。

マサチューセッツ工科大学(MIT、米国ケンブリッジ)の進化生物学者であるSergey Ovchinnikovは、AlphaFold2のコードが公開された直後にそのウェブ版を開発したので、AlphaFold3についてもウェブ版を開発したいと考えていた。残念ながらAlphaFold3のコードは公開されなかったが、論文で提供された豊富な情報に基づいて他のチームが独自のバージョンを作るのにさほど時間はかからないだろうと予想している。「2024年末までにオープンソースのソリューションが公開されるのではないでしょうか」。

翻訳:三枝小夜子

Nature ダイジェスト Vol. 21 No. 8

DOI: 10.1038/ndigest.2024.240813

原文

Major AlphaFold upgrade offers boost for drug discovery
  • Nature (2024-05-08) | DOI: 10.1038/d41586-024-01383-z
  • Ewen Callaway

参考文献

  1. Abramson, J. et al. Nature 630 , 493–500 (2024).

  2. Jumper, J. et al. Nature 596 , 583–589 (2021).

  3. Senior, A. W. et al. Nature 577 , 706–710 (2020).

  4. Krishna, R. et al. Science https://doi.org/10.1126/science.adl2528 (2024).