Research press release


Nature Machine Intelligence

Scientific community: Rules for the responsible use of hacked data

今週Nature Machine Intelligence に掲載されるPerspectiveで、ハッキングによって入手されたデータを研究に使用するための倫理的要件がまとめられている。

近年、大量のデータが公開されるようになったことで、計算科学や機械学習の研究が加速している。WikiLeaksのデータセットや2015年に出会い系サイトAshley Madisonから流出したデータなど、ハッキングによって入手されたデータセットは、科学研究にとってユニークで貴重な情報資源となり得る。しかし、個人の同意が得られていない人間のデータを使用する際の倫理的ジレンマについては、早急に対処する必要がある。

今回、Marcello IencaとEffy Vayenaは、科学における不正行為の歴史的事例や現在の研究倫理指針を参考にしながら、ハッキングによって入手されたデータを使用することのメリットとデメリットを議論し、批判的に評価している。著者たちは、ハッキングによって入手されたデータが公開されていれば、研究者がそれらを使用することは合法であるかもしれないが、責任ある研究行為と言えるためには、当該データの使用について明確な倫理的正当性が必要であると結論付けている。そこで著者たちは、こうしたデータの使用に当たって満たすべき6つの倫理的・手続き的要件を提案している。例えば、研究者はハッキングによって入手された問題のデータセットが他に類を見ないものであることを示すとともに、同様のデータを収集する現実的な代替手段がないことも示す必要があるとされる。研究者はさらにリスクと便益の評価を行い、個人のプライバシーが守られるような対策も講じる必要がある。


A collection of ethical requirements for conducting research using hacked data is presented in a Perspective published in Nature Machine Intelligence.

In recent years, research in computational sciences and machine learning has accelerated as large amounts of data have become publicly available. Datasets that have become available through hacking — such as the WikiLeaks datasets or data leaked from the dating website Ashley Madison in 2015 — can be unique and valuable resources for scientific research. However, ethical dilemmas in using human data where no individual consent has been given need to be urgently addressed.

Marcello Ienca and Effy Vayena discuss and critically evaluate the advantages and disadvantages of using hacked data, drawing upon historical examples of scientific misconduct, as well as current research ethics guidelines. The authors conclude that although it may be lawful for researchers to use hacked data if they are publicly available, responsible research practices still require clear ethical justification for doing so. As such, they propose six ethical and procedural requirements that need to be addressed. For example, researchers need to demonstrate the uniqueness of the hacked dataset in question, and also show that there is no viable, alternative method to collect similar data. Researchers should additionally conduct a risk–benefit assessment and take measures to ensure that individual privacy is preserved.

By proposing this set of ethical requirements, the authors intend to stimulate a debate in the scientific community to clarify when — if at all — hacked data can be used in research, and under what conditions.

This press release refers to a Nature Machine Intelligence Perspective piece, not a Nature Machine Intelligence research article. Perspectives are intended to provide a forum for authors to discuss models and ideas from a personal viewpoint. They are peer reviewed.

doi: 10.1038/s42256-021-00389-w

「Nature 関連誌注目のハイライト」は、ネイチャー広報部門が報道関係者向けに作成したリリースを翻訳したものです。より正確かつ詳細な情報が必要な場合には、必ず原著論文をご覧ください。

メールマガジンリストの「Nature 関連誌今週のハイライト」にチェックをいれていただきますと、毎週最新のNature 関連誌のハイライトを皆様にお届けいたします。