学術界サバイバル術入門 学術誌の編集方針改定に対処する③
Credit: fatmawati lauda/iStock/Getty
よく読んでいる学術誌に、新しい興味深い論文を見つけ、それに非常にインパクトのある結論が書かれていたとしましょう。その結論が妥当であれば、この論文はあなたの研究に強い影響を与えるはずです。データを注意深く検討したところ、そのデータの多くは、あなたにはなじみのない新しいアルゴリズムによって得られています。この研究が影響力を持つ可能性を考えると、重要な発見のいくつかを再現して妥当性を検証したいとあなたは思うことでしょう。しかし、論文で使われたアルゴリズムは市販されていません。研究論文の著者に電子メールで連絡しても、返信はありません。やがて、いら立ちと困惑を感じるようになり……果たして、この研究結果を信じていいのだろうか?という疑問が生じます。
さて、このようなことがあなた個人には起こったことはないかもしれませんが、誰もがこのエピソードの研究者に共感し、そのいら立ちを自分のことのように感じることでしょう。どうすればこの状況を解決できるでしょうか?これはまさにNatureが2014年にコード利用可能要件を定めたときに考えていたことなのです。この要件は、カスタマイズされたコードを使用して研究の結論を導き出した全ての論文において、その結論の中心となったコードを読者が利用できるようにすることを求めるものです。
しかし、ただコードが入手可能というだけで、読者は結果を検証するためにコードをダウンロードしなければならないのでしょうか?必ずしもそうしなければならないわけではありません。論文が採択される前に、研究の方法が査読者によって評価されるのと同様に、方法の一部であるコードも検証されるべきでは? もちろん、その通りです。そこで2018年、Natureは著者ガイドラインを改定し、著者が査読のためにコードを提出するのに役立つ「コードとソフトウエアの投稿チェックリスト(code and software submission checklist)」を加えました(go.nature.com/2HaZr0t、2018年7月号「特注ソフトウエアも査読対象に」参照)。
では、これは著者にとってどのような影響があるのでしょうか? 投稿に当たり、査読者がコードを検証できるように、ソフトウエアおよび/またはソースコードを、インストールガイドとサンプルデータセットを含むリードミー・ファイルと共に提供することを求められます。私たちは、投稿や出版の際に共有を促進するために、コードをGitHub(github.com)のようなリポジトリに預けることを強く推奨しています。オープンソースイニシアチブ(Open Source Initiative)によって承認されたライセンス(opensource.org/licenses/)を使用するとともに、使用制限があれば「コード利用可否についての宣言(Code Availability Statement)」にそれを記載することを推奨しています。最後に、投稿時に必要な「ソフトウエア投稿チェックリスト」(go.nature.com/2h9ouaj)に、これら全てを明確に記載する必要があります。現在、Nature関連誌のうちの19誌が、研究の中心的役割を果たすカスタムコードやアルゴリズムを査読しており、従って、査読段階でコードを提出していなければなりません。出版時には、Zenodo(zenodo.org)やCode Ocean(codeocean.com)のようなデジタルオブジェクト識別子(DOI)付きリポジトリにコードを預け、その後、論文の参考文献で引用することも強く推奨しています(go.nature.com/3ohkfce)。
「コード利用可否についての宣言」には何を含めるべきでしょうか? 読者がその研究で使用されたコードを信頼できるように、必要な全ての情報を含める必要があります。ソースコードにアクセスできる場所の簡単な説明1でもよいですし、ソースコードや学習済みの重み(trained weight)、スクリプト、テンプレート、構築手順、データ解析を含むより詳細な説明でも構いません2。
コードが使用できない場合もあるでしょう。例えば、スーパーコンピューターのような特殊なハードウエアを必要とするため、査読者がコードを検証することが現実的でないようなときです。このようなケースでは、著者は目的とする学術誌に投稿する際、編集者にこの点を明確に説明することをお勧めします。
最後に、特にコード開発とは関係ありませんが、論文原稿作成におけるChatGPTのような大規模言語モデル(LLM)の使用に関する、最近のNatureの編集方針を紹介したいと思います(go.nature.com/3c5vrtm)。原稿作成におけるLLMの使用は認めますが、原稿の方法のセクションに明確かつ透明にそれを記述する必要があります。どのバージョンのLLMを使用したのか(例えばChatGPT 3.5なのか4.0なのか)、原稿のどのセクションで使用したのかをはっきりと示す必要があります(2023年4月号「ChatGPTと類似ツールの利用に関するNatureの基本原則」参照)。また、LLMによって生成された内容を検証することも強くお勧めします。LLMは虚偽の情報を生成することがあるからです。これはハルシネーション(幻覚)として知られています3。著者であるあなたは論文の内容に責任を持たなければなりませんから、その内容が妥当で、正確で、信頼できるものであることを確認しておかなければなりません。
以上で、論文を発表する際のコードの利用可能性と透明性に関するNatureの編集方針を明らかにできたかと思います。次回は、幹細胞を用いた研究に関するNatureの編集方針についての最新情報を取り上げる予定です。
次回は、2023年12月号の予定です。
これまでのTrainingはこちらからご覧いただけます。
ジェフリー・ローベンズ(Jeffrey Robens)
Nature Masterclasses 筆頭講師。自然科学分野で多数の論文発表と受賞の経験を持つ研究者でもある。
Nature Masterclasses は、科学コミュニケーションの基礎から、よりインパクトの高い発表戦略、研究データの原則や、助成金申請、求人応募、臨床研究方法論ほか、学術界で成功するためのノウハウを提供するワークショップです。
翻訳:古川奈々子
Nature ダイジェスト Vol. 20 No. 10
DOI: 10.1038/ndigest.2023.231036
参考文献
- Song, L. et al. Nat Comput. Sci. https://www.nature.com/articles/s43588-023-00487-2#code-availability (2023).
- Jumper, J. et al. Nature https://www.nature.com/articles/s41586-021-03819-2#code-availability (2021).
- McKenna, N. et al. Preprint at https://doi.org/10.48550/arXiv.2305.14552 (2023).
関連記事
キーワード
Advertisement
