ChatGPT登場から2年:科学者の生活はどう変わったか
ChatGPTは、人間が作成した大量のデータから学習する生成人工知能(AI)システムである。 Credit: Nicolas Economou/NurPhoto via Getty
2022年11月30日にChatGPTが一般公開されてから2年が過ぎ、研究者らはこれを使って学術論文に磨きをかけたり、科学文献をレビューしたり、データ解析用のコードを書いたりするようになっている。ChatGPTが科学者の生産性を向上させたと考える人々がいる一方で、ChatGPTは剽窃(ひょうせつ)を容易にし、科学に不正確さを持ち込み、大量のエネルギーを猛烈な勢いで消費すると懸念する人々もいる。
出版社ワイリー(Wiley、米国ニュージャージー州ホーボーケン)は、2024年3~4月に1043人の研究者を対象に、ChatGPTなどの生成人工知能(AI)ツールの使用状況に関する調査を行い、その予備的な結果をNatureに発表した。ChatGPTは学術界で圧倒的な人気を誇っていて、回答者の81%が個人的に、または仕事で使ったことがあると答えていた(2023年5月号「Nature読者のChatGPT利用法」参照)。また回答者の4分の3が、5年後には研究者が仕事をする上でAIスキルを身に付けることが重要になると思うと述べていた。
スタンフォード大学(米国カリフォルニア州)のAI研究者であるJames Zouは、「AIライティング補助ツールは以前から使われていましたが、非常に強力な大規模言語モデル(LLM)が公開されたことで、かなり大きな変化が起こりました」と言う。中でも、テック企業オープンAI(OpenAI、米国カリフォルニア州サンフランシスコ)が開発したチャットボットChatGPTの基礎にあるLLMがもたらした変化は衝撃的だった。
ChatGPTが2歳を迎えたことを記念し、NatureはChatGPTの使用状況に関するデータを収集し、このチャットボットが研究のあり方をどのように変えたか、科学者らに話を聞いた。
数字で見るChatGPT
・6万編:2023年に発表された学術論文のうち、LLMの力を借りて執筆されたと推定される論文数の下限1。これは、研究チームが調査した学術出版物データベースDimensionsに含まれる全論文の1%強に相当する。
・10%:2024年前半に生物医学研究者によって発表された研究論文のうち、LLMの力を借りて要旨を執筆したと推定される論文の割合の下限2。2024年2月に計算機科学コミュニティーを対象に行われた別の研究では、この割合はもっと高く、17.5%と推定された3。
・6.5~16.9%:2023年と2024年に開催された主要なAI会議に提出された査読報告書のうち、LLMによって大部分が作成されたと推定される査読報告書の割合4。これらの査読報告書は、研究論文や会議のために提案されたプレゼンテーションを評価するものである。
ライティング補助ツール
ベルリン技術経済大学(ドイツ)の計算機科学者で剽窃研究者のDebora Weber-Wulffは、これらの数字はいずれも、おそらく控えめな数字であると指摘する。文章中に見られるLLMに特徴的なパターンやキーワードを評価することで得られた推定値であるからだ。彼女が行った研究によると、AIが生成した文章を検出するためのツールでは、AIの力を借りて執筆された論文を識別できないという5。
科学者らは、論文要旨や研究資金の申請書、学生を支援するための手紙の草稿をChatGPTを使って作成することで、複雑な作業に集中しやすくなったと感じている。コロラド大学医学系大学院(米国オーロラ)の医療情報学者であるMilton Pividoriは、「私たちの時間を割く価値があるのは、難しい問いと創造的な仮説なのです」と言う。
研究者らは、LLMが特に威力を発揮するのは、言語の壁を乗り越えるときだと言う。カーネギー・メロン大学(米国ペンシルベニア州ピッツバーグ)の化学者であるGabe Gomesは、「LLMはライティングを民主化し、母語が英語でない人々を助けてくれます」と言う。2024年11月にプレプリントサーバーSSRNに投稿された査読前論文によると、ChatGPTの公開後、母語が英語でない著者の論文の文章の質が向上しており、彼らの文章の質の向上の度合いは英語に堪能な著者の論文の場合よりも大きいことが明らかになったという6。
2022年の公開以来、ChatGPTは何度かアップグレードされている。2023年3月に公開されたGPT-4は、人間が書いたような文章を生成する能力でユーザーを感嘆させた(2023年5月号「GPT-4登場:科学者たちの見方」参照)。オープンAI社は、2024年9月に最新のLLMであるo1(オーワン)を発表し、有料顧客と一部の開発者に試験的に提供しており、o1は「複雑なタスクを論理的に処理し、科学、コーディング、数学の分野で、以前のモデルよりも難しい問題を解くことができる」としている(27ページ「AIの知的レベルはどこまで人間に近づいたのか?」参照)。ベイエリア環境研究所(米国カリフォルニア州モフェットフィールド)のデータサイエンティストのKyle Kabasaresは、o1を使って自身の博士課程プロジェクトのコードの一部を再現してみた。自身の論文の「方法」セクションの情報を含めたプロンプトを入力すると、AIシステムはKabasaresが大学院在学中にほぼ1年がかりで書いたコードをわずか1時間で書き上げた。
Pividoriによると、ChatGPTや同様のAIシステムがあまり成功していない分野の1つは文献レビューであるという。「AIシステムは、この分野では私たちの生産性の向上にあまり役立ちません」。研究者は、自分の専門分野に関連する論文を熟読して理解する必要があるからだ。「自分の研究にとってさほど重要でない論文なら、AIツールを使って要約してもよいかもしれません」と彼は言う。しかし、LLMはハルシネーション(幻覚)を起こすことが分かっている7。これは情報をでっち上げることであり、例えば、存在しない図について語ったりする可能性がある。
プライバシーと生産性
プライバシーも懸念事項の1つである。例えば、科学者が論文執筆のために未発表のオリジナルデータをAIツールに入力すると、その内容がこれらのモデルの最新版の訓練に使われてしまう恐れがある。「AIツールはブラックボックスです」とWeber-Wulffは言う。「アップロードしたデータがどうなるのか、全く分からないのです」。
その危険性を回避するため、一部の研究者はChatGPTではなく小規模なローカルモデルを使用している。Pividoriは、「自分のコンピューター上で実行し、外部とは何も共有しません」と言う。また彼は、ChatGPTのサブスクリプションプランの中には、自分のデータがモデルの訓練に使用されないようにできるものもあると説明する。
研究者らはこの1年間、ChatGPTが仮想アシスタントの役割を超えて、AIサイエンティストになることはできるのかという大きな問いを追い掛けてきた。いくつかの予備的な取り組みは、それが可能であることを示唆している(2024年12月号「科学者が開発した『AIサイエンティスト』の実力は?」参照)。Zouは、LLMが学際的なチームの科学者の役割を担い、人間の科学者が高度なフィードバックをする仮想研究室の開発を主導している(12ページ「『AIサイエンティスト』の支援で急速に進化する仮想研究室」参照)。「LLMと人間が協力して、新しい研究プロジェクトを策定するのです」とZou。彼らは2024年11月に、1つのプロジェクトの結果をまとめた査読前論文をプレプリントサーバーbioRxivに投稿した8。この研究では、仮想研究室が新型コロナウイルス感染症(COVID-19)のパンデミックを引き起こした重症急性呼吸器症候群コロナウイルス2(SARS-CoV-2)の各種変異株と結合できるナノボディ(小分子抗体の1種)を設計した。次に、人間の研究者が実験を行ってこれらを確認し、さらなる研究の価値のある有望なナノボディ候補を2つ特定した。
Gomesらは、ChatGPTを研究室で使うことにも期待を寄せている。彼らは2023年後半に、ChatGPTを利用していくつかの化学反応を設計し、ロボット装置の力を借りて実際に行った。「LLMが新しい科学を発見することを期待しています」とGomesは言う。
翻訳:三枝小夜子
Nature ダイジェスト Vol. 22 No. 3
DOI: 10.1038/ndigest.2025.250314
原文
ChatGPT turns two: how the AI chatbot has changed scientists’ lives- Nature (2024-12-02) | DOI: 10.1038/d41586-024-03940-y
- Mariana Lenharo
参考文献
Gray, A. Preprint at arXiv https://doi.org/10.48550/arXiv.2403.16887 (2024).
Kobak, D., González-Márquez, R., Horvát, E.-Á. & Lause, J. Preprint at arXiv https://doi.org/10.48550/arXiv.2406.07016 (2024).
Liang, W. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2404.01268 (2024).
Liang, W. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2403.07183 (2024).
- Weber-Wulff, D. et al. Int. J. Educ. Integr. 19, 26 (2023).
Liang, Y., Yang, T. & Zhu, F. Preprint at SSRN https://doi.org/10.2139/ssrn.4992755 (2024).
- Farquhar, S. et al. Nature 630, 625–630 (2024).
Swanson, K., Wu, W., Bulaong, N. L., Pak, J. E. & Zou, J. Preprint at bioRxiv https://doi.org/10.1101/2024.11.11.623004 (2024).
関連記事
キーワード
Advertisement