AIは仮想細胞を構築できるか?生命の最小単位をモデル化する競争
仮想細胞モデルは、腫瘍細胞(画像はイメージ)の薬剤への反応を予測するのに役立つ可能性がある。 Credit: Kateryna Kon/Science Photo Library/Getty
Stephen Quakeの思う通りに事が進めば、未来の生物学者はピペットを使う時間が大幅に少なくなるだろう。「私たちの目標は、計算ツールを作り出して、細胞生物学を実験90%・計算10%という構図から、計算が主役となるよう逆転させることです」とQuakeは言う。
チャン・ザッカーバーグ・イニシアチブ(CZI、米国カリフォルニア州レッドウッドシティ)の科学部門の責任者であるQuakeは、仮想細胞を生成する取り組みを主導する研究者の1人である。仮想細胞とは、腫瘍細胞が特定の薬剤に対してどのように反応するかなど、現在なら実験に数週間かかるような課題に対して、ある種の知見を生み出せる人工知能(AI)モデルのことである。
「仮想細胞は、疾患において何がうまく機能していないのかを理解するための非常に強力なツールとなるでしょう」と、Quakeは言う。彼が思い描くのは、科学者らが仮想細胞による予測を検証するために、主に実験を用いるようになる未来である。
仮想細胞を作る取り組みはまだ初期段階にあるが、この考え方は世界中の学術界と産業界の両方の研究室の強い関心を引き付けている。オープンなデータセットとツールを開発する非営利団体であるCZIは、今後10年間で仮想細胞の構築に数億ドル(数百億円)を投じることを計画している。また、グーグル・ディープマインド社(Google DeepMind、英国ロンドン)も仮想細胞プロジェクトを行っていると、同社の最高経営責任者Demis Hassabisが2025年の初めに語っている。
スウェーデンの国立研究機関であるScience for Life Laboratory(SciLifeLab、ソルナ)の分子生物学者Jan Ellenbergは、「これは途方もない挑戦です」と言う。Ellenbergは、SciLifeLabの仮想細胞モデル「Alpha Cell」の開発を共同で率いており、このモデルは2026年に公開予定である。「今可能で、今必要なことは、最初の先駆的なプロジェクトを進めて、仮想細胞が原理的に機能し得ることを示すことです」。
しかし、仮想細胞は生物学の重要な長期目標であるものの、その開発競争については過剰な期待が先行していて、具体的な成果や成功への明確な道筋はほとんど示されていないと言う研究者もいる。「仮想細胞は、主にスローガンや資金調達の仕組みとして用いられていて、実際にその点ではうまく機能しているのです」と、スタンフォード大学(米国カリフォルニア州)の計算生物学者Anshul Kundajeは言う。「投資家は巨額の資金をこの分野に投じています」。
計算モデルに潜む問題点
生物学者は数十年にわたり、コンピューターを使って細胞の挙動をモデル化してきた。2012年には、遺伝子数がわずか525のマイコプラズマ属細菌Mycoplasma genitaliumの内部の挙動を捉えた、1個の細胞全体の最初の計算モデルが生み出された1。
しかし、これらをはじめとする初期の取り組みは「細胞の完全な機構モデルを実際に構築しようとすることが多かった」と、アーク研究所(Arc Institute、米国カリフォルニア州パロアルト)の計算生物学者Silvana Konermannは言う。対照的に、現在の仮想細胞の開発は、AIの進歩を活用することで推進されている。膨大なデータを与えられたAIは、大規模言語モデル(LLM)が高度な文章表現を生成できるように、洗練されたデータ表現を作り出せるようになった。「データから学習するモデルを構築することは革新的なのです」とQuakeは言う。
初期の仮想細胞は、主に1種類のデータ、すなわち個々の細胞に含まれる全てのメッセンジャーRNA分子の塩基配列を解読した実験データに重点を置いていた。これは、遺伝子活性のカタログであり、細胞の現在の状態のスナップショットでもある。
こうしたデータは、ヒトや他の生物のさまざまな細胞タイプをマッピングした「アトラス」の基盤となり、これまで正しく評価されてこなかった細胞の多様性を明らかにする。研究者らは現在、「単一細胞塩基配列解読」データセットを大量に作り出して、仮想細胞の構築に役立てている。CZIは今後、10億個の細胞の塩基配列解読データ(既存の1億個以上の細胞のデータベースを拡張したもの)を公開する予定であり、アーク研究所は2025年2月に、数百の薬剤で処理した1億個のがん細胞の塩基配列解読データを公開した。
単一細胞塩基配列解読データは魅力的だと、アーク研究所のシステム生物学者Hani Goodarziは言う。こうしたデータは、LLMが高度な能力を獲得し始めるのと同程度の規模(すなわち、数千億のデータポイント)で、しかも比較的低価格で生成できるからである。
仮想細胞モデルが実現すれば、研究者が細胞培養実験に費やす時間は大幅に減るかもしれない。 Credit: Wirestock/iStock/Getty
細胞を構築する競争
研究者らはこれらのデータを用いて単一細胞AIモデルの開発を始めている。アーク研究所は2025年6月末に、Stateと呼ばれるモデルを発表した。これは、同研究所の最初の仮想細胞モデルである。また、同研究所は、このようなモデルを用いてヒト幹細胞の遺伝的変化への反応を予測する、賞金総額17万5000ドル(約2600万円)の仮想細胞コンテストを開始した。
しかし、これらのモデルは、訓練されたデータの枠を超えた結論を導けるほど強力でもなければ予測力があるわけでもないと言う研究者もいる。Kundajeは、新しいデータセットを用いていくつかの単一細胞モデルを検証した取り組み2,3を示して、「これらは完全な失敗です」と言う。
多くの研究者は、仮想細胞には光学顕微鏡画像や電子顕微鏡画像など、他の形式のデータも組み込む必要があると言う。これらのデータによって、細胞のさまざまな構成要素がどのように相互作用するかや、細胞が経時的にどのように変化するかを明らかにできる。「私たちは、単一細胞塩基配列解読データを超えて進む必要があります」とEllenbergは言う。
仮想細胞開発の課題の一部は、この概念が人によって異なる意味を持つことである。「仮想細胞の明確な定義はないと思います」と、CZIの10億細胞プロジェクトを率いるJonah Coolは言う。
このことは、ハーバード大学医学系大学院(米国マサチューセッツ州ボストン)の細胞生物学者Tim Mitchisonにとっても明白だった。彼は、仮想細胞を構築する道筋を描くためのCZIのワークショップに参加した際、参加者の間でコンセンサスがほとんど得られていなかったと語る。「それでも、今後については非常に楽観しています」とMitchisonは言う。彼は、心筋細胞や腸オルガノイドなどの個々の細胞タイプ、あるいは遺伝子調節のような機能についての真に有用なAIモデルが、近いうちに実現すると考えている。
Quakeは、細胞生物学者を実験台から解放するという自身の構想が受け入れられるまでには時間がかかると認めている。幸いにも、適応するための時間は十分にある。「細胞生物学者の準備はまだできていませんが、モデルも、生物学者を受け入れる準備が整っていないのです」とQuakeは言う。
翻訳:三谷祐貴子
Nature ダイジェスト Vol. 22 No. 10
DOI: 10.1038/ndigest.2025.251014
原文
Can AI build a virtual cell? Scientists race to model life’s smallest unit- Nature (2025-06-27) | DOI: 10.1038/d41586-025-02011-0
- Ewen Callaway
参考文献
- Karr, J. R. et al. Cell 150, 389–401 (2012).
- Kedzierska, K. Z., Crawford, L., Amini, A. P. & Lu, A. X. Genome Biol. 26, 101 (2025).
- Csendes, G., Sanz, G., Szalay, K. Z. & Szalai, B. BMC Genom. 26, 393 (2025).
関連記事
Advertisement