Feature

「暗黒タンパク質」はヒトゲノムの認識をどう変えるか

Illustration: Fabio Buonocore

ホワイトヘッド研究所(米国マサチューセッツ州ケンブリッジ)の分子生物学者Jonathan Weissmanは、カリフォルニア大学サンフランシスコ校(米国)に勤務していた2009年、細胞内で何が起こっているか、特に、ある瞬間にどのタンパク質が産生されているのかを調べる新しい方法を研究していた。これは、Weissmanと当時ポスドクだったNicholas Ingolia(現在はカリフォルニア大学バークレー校に所属)による、細胞のタンパク質工場であるリボソームの生産物を直接測定する方法の共同開発につながった。

この方法は、リボソームプロファイリングと呼ばれ、1つの細胞の全てのリボソームを回収して、リボソームに結合しているメッセンジャーRNAの個々の鎖の塩基配列解読を行う。WeissmanとIngoliaは、リボソームプロファイリングによって細胞が生産する全てのタンパク質とその相対量を正確に把握できることを期待していた。

しかし、Weissmanを含め、多くの研究者がリボソームプロファイリングを始めると、非常に意外な結果に向き合うことになった。リボソームは、細胞のゲノムの既知遺伝子がコードするタンパク質をせっせと生産しているだけでなく、ゲノムにはマッピングされるがタンパク質を作り出すと予想されていなかったおびただしい数の小さなタンパク質、「暗黒タンパク質」も生産していると考えられたのだ1。「『そう来たか!』と思いました」と、Weissmanは言う。ほどなく、Weissmanをはじめとする研究者らは、調べたほぼ全ての生物で、この予期せぬ翻訳事象が起こっていることを明らかにした。

このときから15年、研究者らは今も、暗黒タンパク質をどう解釈すべきか頭を悩ませている。

暗黒タンパク質の多くはとても小さく、数十残基以下のアミノ酸で構成されていることが多い。また、あまり見掛けない配列であることが多く、他の生物のゲノムに近縁タンパク質が存在していない。これまでの研究から、一部の暗黒タンパク質は細胞において重要な役割を担い、ヒトの健康に影響を及ぼす可能性が示唆されている。さらに暗黒タンパク質は一部のがんに豊富に存在するようで、暗黒タンパク質を標的とした治療法の開発を考えている企業もある。しかし、多くの暗黒タンパク質の存在は謎に包まれていて、何か重要な役割を担っているというはっきりとした証拠はなく、継続的に細胞内に存在しているかどうかさえも定かでない。

シャーブルック大学(カナダ・ケベック州)でプロテオミクスを研究しているMarie Brunetは、問題は研究者自身が何を見逃しているのか本質的に分かっていないことだと言う。「得られた塩基配列がデータベースにないタンパク質だとしても、実際にそのタンパク質を見つけようとすらしないのです」。

遺伝子の数という難題

Brunetは、ヒトゲノムにコードされている暗黒タンパク質を全て記録するという世界的なプロジェクトに参加している(「暗黒プロテオームの探索」参照)。目標は、暗黒タンパク質に研究者の注意を向けることで、そうすればこの謎のタンパク質が何をしているのかを分子ごとに調べ始めることができる。

Source: J. R. Prensner et al. Mol. Cell Prot. 22, 100631 (2023).

プリンセス・マキシマ小児腫瘍センター(オランダ・ユトレヒト)のシステム生物学者Sebastiaan van Heeschも、このプロジェクトに参加しており、今後の展開に期待していると言う。「そこには間違いなく新しい生物学があります」。

2000年代初頭にヒトゲノムが最初に報告されるまで、研究者らは、解読された塩基配列データを熱心に調べて、タンパク質コード遺伝子の数を推定しようとしていた。通常、ゲノム解析では、オープンリーディングフレーム(ORF)という、タンパク質を作るコードとなる特定の3文字の塩基配列(コドン)を含む長い領域(コード領域)が探索される。さらに、その塩基配列が、異なる生物間でも保存されている証拠や、適切な長さである証拠など、機能的タンパク質をコードする遺伝子としての要素が探索される。こうした要素の全てから、結果として生じるタンパク質が細胞において機能を持つ可能性が示唆される。

多くのORFはこの基準を満たさないため、機能的遺伝子かどうかの推定を精査する際に無視されるか、単に見落とされた。GENCODEプロジェクトなど、候補遺伝子のリストを維持管理しているコンソーシアムには、現在、2万弱のタンパク質コード遺伝子のリストが収蔵されており、その約90%は、他のプロジェクトにより、対応するタンパク質を産生することが確認されている(個々の遺伝子は複数の異なるタンパク質をコードできる。というのも、個々の遺伝子から産生されるタンパク質は、エキソンと呼ばれるコード領域をつなぎ合わせた配列が翻訳されたものであるが、どのエキソンを含め、どのエキソンを省くかにより、複数の異なるタンパク質が産生され得るためである)。さまざまな研究チームから新たなデータが日々公表されており、GENCODEをはじめとするデータを管理する組織では定期的にリストを更新している。

しかし、ミシガン大学医学系大学院(米国アナーバー)のがん生物学者John Prensnerによると、遺伝子数の計算は不完全だと言う。2001年にヒトゲノム全塩基の概要配列について論文発表された時点で、タンパク質コード遺伝子の完全なリストを作成できたという考えは、広く誤解されている認識だ。「ヒトゲノム計画を率いた研究者らは、議論の出発点であることを常に認識していました」とPrensnerは言う。

リボソームの産物を直接測定できるようになったことで、見落とされていたORFや、それらが機能的なタンパク質をコードする可能性への関心が爆発的に高まった。Prensnerおよびvan Heeschらが共同で率いる研究チームは、こうした「非カノニカルな」ORFを7000以上含むリストをまとめ、2022年、Nature Biotechnologyのcorrespondenceに投稿した(これは非カノニカルORF数の下限値だとvan Heeschは言う。他の研究では、ヒトゲノムにコードされている数万もの暗黒タンパク質候補が特定されている)。これらのORFは一般に、タンパク質コード遺伝子と考えられる要件を満たさないため、データベースからは除外されている2

このリストにまとめられた、従来とは異なるこうした非カノニカルなORFのほとんどは、カノニカルなタンパク質コード遺伝子の近傍やその一部と重複して見つかっている。そのうちの約3分の1は長鎖非コードRNAと呼ばれる塩基配列中に存在し、その名前が示すように、タンパク質をコードしていないが、調節の役割を担っていると考えられていた。

しかし、ORFがタンパク質に翻訳されるからというだけで、そのタンパク質が細胞内で安定的に存在したり、重要な役割を担っていたりするわけではない。Prensnerらによれば、リボソームが行う一部の非カノニカルなORFの翻訳は、細胞が近傍の遺伝子の活性を制御する1つの方法なのかもしれないという。例えば、迅速に分解される産物をリボソーム装置に翻訳させて近傍の遺伝子の翻訳を妨げることで、近傍遺伝子の活性を調節しているのかもしれない。この種の制御は、タンパク質コード配列の前方に位置する特定の「上流ORF」で起こる。

2022年のNature Biotechnologyの発表をフォローアップした査読前論文で、Prensner、van Heeschをはじめとするゲノミクスやプロテオミクスの専門家からなる拡大コンソーシアムは、数百のプロテオミクスデータセット(数十億のデータポイントを含む)と、質量分析法などの手法を用いて細胞内のタンパク質を特定した研究結果を徹底的に調べた3。すると、2022年に特定した非カノニカルORFのうち1700以上に対応するタンパク質断片が見つかった。研究者らは、このうち15について、タンパク質とそれに対応する遺伝子を特定し、タンパク質コード遺伝子の公式な集計に追加するのに十分強力な証拠を得ていると述べている。

しかし、ほとんどの非カノニカルなORFについては、タンパク質を作り出せるという明確な証拠が不足している。この問題の1つは、候補タンパク質のサイズが非常に小さいことである。これらのタンパク質は100アミノ酸よりはるかに短いことが多く、マイクロタンパク質と呼ばれている(ヒトのタンパク質は平均数百アミノ酸で構成されており、これよりはるかに長いタンパク質も多い)。このように非カノニカルなORFは長さが短いため、対応するタンパク質断片を見つけるのが難しい。プロテオミクス実験では、タンパク質を切断し、生じた断片を質量で特定する。だが、細胞試料中のマイクロタンパク質の存在が少ない場合は特に、より長いタンパク質の断片が過剰に検出されてしまうとvan Heeschは言う。

AlphaFoldと呼ばれる人工知能ツールを用いて暗黒タンパク質の構造を予測すると、暗黒タンパク質は、うまく折りたたまれたカノニカルなタンパク質とはほとんど似ていないことが多い。しかしPresnerは、「カノニカルなタンパク質に非常によく似ていて、見過ごされていただけだったという明らかな例があります」と言う。データベースを管理するGENECODEなどの組織は、こうした見落とされていたタンパク質をリストに追加し始めている。

欧州バイオインフォマティクス研究所(EMBL-EBI、英国ヒンクストン)の研究者で、GENCODEプロジェクトに携わり、この査読前論文の共著者でもあるJonathan Mudgeは、リボソームプロファイリングにより特定された約50の塩基配列が、ヒトのタンパク質コード遺伝子のリストに追加されていると言う。

しかし、「新たな候補をリストに付け加えることは慎重に行われています」とMudgeは付け加える。実験の結果を理解するためにGENCODEのような取り組みに頼っているのは、生物学者だけではない。臨床医もこうしたデータベースに依存しており、疑わしいタンパク質コード遺伝子がデータベースに多数追加されると、患者のゲノムで見つかった有害なバリアントを特定する労力が複雑になる可能性があるのだとMudgeは言う。「私たちは疑い深いのではありません。ただ慎重なだけなのです」。

遺伝子編集で明らかに

暗黒タンパク質がゲノムにコードされている可能性に注目が集まり始めた頃、画期的な手法が開発され、細胞におけるタンパク質の効果を系統的に調べることができるようになった。CRISPR–Cas9遺伝子編集である。「突然、非カノニカルなタンパク質のコード配列を切断して取り除き、こうした配列が細胞の機能に重要かどうか調べられるようになったのです」とWeissmanは言う。

Weissmanの研究チームは、暗黒タンパク質の重要性を実証した論文を2020年にScienceに発表した。研究チームは、ヒト誘導多能性幹細胞やがん細胞株において、CRISPR–Cas9遺伝子編集を用いて数千の非カノニカルなORFを編集し、タンパク質への翻訳を阻害した4。このうちの数百の例で、CRISPR–Cas9編集によって細胞の増殖異常が引き起こされた。「実際、多くのマイクロタンパク質が細胞にとって重要でした」とWeissmanは言う。

さらなる実験で、暗黒タンパク質が重要である理由が解明できた。一部の例では、非カノニカルなORFにコードされるタンパク質は、同じmRNA鎖にコードされるタンパク質と相互作用した。これは、共調節される細菌遺伝子がオペロンと呼ばれる単位において互いに隣り合って存在する傾向があることによく似ていると、Weissmanは言う。彼の研究チームが特定した機能的な暗黒タンパク質は、細胞において多様な役割を担っており、細胞周期に関与したり、ミトコンドリアの生理機能に関与したりすると考えられている。

Source: J. R. Prensner et al. Mol. Cell Prot. 22, 100631 (2023)

がん細胞には暗黒タンパク質が特に豊富に含まれる可能性がある。小児神経腫瘍医でもあるPrensnerは、ヒトゲノム全てに存在する非カノニカルなORFが一部のがんで誤調節される可能性を研究しており、この誤調節が、がん専門医が目にする患者の治療転帰の違いに関わっている可能性がある。「私たちは、がんはなぜこうした暗黒タンパク質を産生しているのかという核心を調べています」。

Prensnerが率いる研究チームは、Weissmanらと同様の実験で、CRISPR–Cas9編集により不活化した500以上の非カノニカルなORFのうち約10%が、さまざまな種類のヒトがん細胞で増殖異常を引き起こすことを見いだした5。さらにPrensnerらは、乳がん細胞株において高レベルで発現し、増殖を促進していると考えられる暗黒タンパク質も特定した。

またPrensnerとvan Heeschらは、2024年に発表した研究で、小児脳腫瘍で致死的となることもある髄芽腫に関与する暗黒タンパク質をいくつか特定した6。その一例として、彼らは、隣接するORFがコードするカノニカルなタンパク質とは独立して、暗黒タンパク質が、過剰活性型のMYCがん遺伝子を持つ非常にアグレッシブなタイプの髄芽腫の増殖を促していることを示している。

このような例は氷山の一角だと、van Heeschは言う。正常細胞および疾患細胞における暗黒タンパク質の機能の解明はさらに多くの研究を行う必要があり、そのためにも他の研究者に暗黒タンパク質に注目してもらう必要がある。「こうした研究の1つを行うには3~4年かかります。私たちは数千もの研究を発表していますが、まだ発見されていない生物学的性質が山ほどあります」と、van Heeschは言う。

ごみ出しをする

リボソームがmRNAを翻訳してタンパク質を産生しているイメージ図。 Credit: Quantic69/iStock/Getty

しかし、この多数の暗黒タンパク質候補の中から機能するものとしないものを選別するのは気が遠くなるほど困難である。「全細胞プロテオミクスによって観察されるタンパク質種は、不安定で機能していないことが多く、言うなればごみの山です。細胞はアミノ酸配列を作り出しては、ごみ圧縮機に入れて出口から外へ吐き出しているようなものなのです」とPrensnerは言う。

ごみ圧縮機のごみ放出口には、ヒトではヒト白血球抗原(HLA)複合体と呼ばれる免疫監視システムがあり、細胞の表面にタンパク質の断片を提示する。このシステムは、免疫細胞が正常な組織を攻撃しないように訓練したり、ウイルスやがん性細胞などの脅威を警告したりするのに役立つ。細胞が作り出すほぼ全てのタンパク質鎖は、機能しないものでさえも、HLAに提示されることになる。

実際、ヒトで特定された暗黒タンパク質の大部分は、HLA複合体によって提示されるペプチドを特定する技術を用いて見つかっている。コロンビア大学(米国ニューヨーク)の分子生物学者、呉雪兵(Xuebing Wu)は、「暗黒タンパク質に関する他の目印がほとんど見つかっていないという事実は、暗黒タンパク質の大部分が翻訳エラーであるか、翻訳を調節する役割のみを持つことを示唆しています」と言う。彼は、多くの暗黒タンパク質が、非常に迅速に細胞の再利用系に入ってしまい、特定の義務を果たすことができないのではないかと考えている。

呉らは、2023年のNatureの論文で、多くの暗黒タンパク質が、リボソームからごみ圧縮機へ真っすぐ効率的に送られる化学的シグネチャーを持つことを見いだしている7。一方、ごく一部の暗黒タンパク質が細胞膜に導かれる機構も明らかにしている。細胞膜では暗黒タンパク質は分解から免れ、進化して新しい役割を獲得する機会が与えられている。さらに呉の研究チームは、2025年初めに発表した総説8で、機能的と考えられる約1000の暗黒タンパク質を特定したことを報告している。細胞は、問題を引き起こす可能性のある暗黒タンパク質を除去しながらも、新たな機能獲得の可能性を妨げないようにバランスを取る必要があると、呉は言う。

研究者らは、たとえほとんどの暗黒タンパク質に明確な特定の機能がなくても、その存在自体が重要である可能性があると言う。多くの暗黒タンパク質が、免疫系によって断片が提示された場合のみ発見されているという事実から、免疫における役割が示唆されるかもしれないと、van Heeschは言う。リボソームはエネルギーを大量に消費する細胞小器官であり、これら暗黒タンパク質を産生するコストは「非常に大きい」と彼は言う。「にもかかわらず、なぜ細胞はジャンク配列を何度も繰り返し翻訳するのでしょうか?」。

暗黒タンパク質が細胞で何をしているかにかかわらず(たとえ何もしていなくても)、製薬会社は暗黒タンパク質を有望な治療標的と見なし始めている。エナラバイオ社(Enara Bio、英国オックスフォード)やニーモセラピューティクス社(Mnemo Therapeutics、フランス・パリ)など、いくつかのバイオテクノロジー企業は、がん細胞によって産生されて、HLA複合体に提示される「暗黒抗原」を標的とする免疫細胞療法を開発している。中国では臨床試験が2025年に開始予定で、暗黒プロテオームを標的とする最初の臨床試験の1つとなる。この臨床試験では、マウスで有望な結果が観察されたことを受けて、一部の乳がんで産生される暗黒タンパク質で免疫細胞を活性化するワクチンが治療転帰を改善できるかどうかが検討される9。また、Prensnerが顧問を務めるプロファウンドセラピューティクス社(ProFound Therapeutics、米国マサチューセッツ州ケンブリッジ)は、巨大製薬会社ファイザー(Pfizer)と共同で、暗黒プロテオームを標的として、肥満治療薬の探索を行っている。

しかし、研究者らは暗黒タンパク質の生物学的意義そのものにも非常に興味を持っている。暗黒タンパク質は進化における遺伝的革新の実験場である可能性を推測する研究者もいる。「私たちは、新たな機能的なタンパク質が生まれる瞬間を見ているのかもしれません」とWeissmanは言う。

van Heeschらは、ヒトを含むさまざまな霊長類系統において出現したと考えられる暗黒タンパク質の1グループを特定し、一部が心機能に関与することを、2024年にNature Cardiovascular Researchで発表している10。しかし、革新には代償が伴うかもしれない。これらの暗黒タンパク質は、進化的に保存された遺伝子よりも、心疾患患者の細胞において誤って発現する傾向がある。また正常な発生過程における役割を獲得した暗黒タンパク質が異常を来し、がん、特に小児がんを引き起こすという可能性があると、Prensnerは付け加える。

暗黒プロテオームに注目している研究者らは、暗黒タンパク質分子が細胞で何をしているのかについて一概には言えず、その答えは他の生物学分野と同様に、厄介で複雑になるだろうと考えている。しかし、Prensnerやvan Heesch、そして同様の考えを持つ研究者らは、生物学者にはとにかく暗黒タンパク質に注目してほしい、そして、暗黒タンパク質をどのように分類するかについてはあまり気にしないでほしいと、ただ願っている。「私が言いたいのは、しゃくし定規に考えなくてよいということです」とvan Heeschは言う。

翻訳:三谷祐貴子

Nature ダイジェスト Vol. 22 No. 4

DOI: 10.1038/ndigest.2025.250438

原文

‘Dark proteins’ hiding in our cells could hold clues to cancer and other diseases
  • Nature (2025-01-30) | DOI: 10.1038/d41586-025-00217-w
  • Ewen Callaway
  • ロンドンからNatureに寄稿

参考文献

  1. Ingolia, N. et al. Science 324, 218–223 (2009).
  2. Mudge, J. M. et al. Nature Biotechnol. 40, 994–999 (2022).
  3. Deutsch, E. W. et al. Preprint at bioRxiv https://doi.org/10.1101/2024.09.09.612016 (2024).

  4. Chen, J. et al. Science 367, 1140–1146 (2020).
  5. Prensner, J. R. et al. Nature Biotechnol. 39, 697–704 (2021).

  6. Hofman, D. A. et al. Mol. Cell 84, 261–276 (2024).
  7. Kesner, J. S. et al. Nature 617, 395–402 (2023).
  8. Azam, S., Yang, F. & Wu, X. Trends Genet. 41, 107–118 (2025).
  9. Huang, D. et al. Nature 625, 593–602 (2024).
  10. Ruiz-Orera, J. et al. Nature Cardiovasc. Res. 3, 1217–1235 (2024).