News

公開データは自由に再利用してよいか?

Daniel Himmelstein。 Credit: STEVE BABULJAK

第三者がネット上の公開情報に基づいて何かを作ろうとする場合、その利用許可を得るのは驚くほど困難だ。無料オンラインリソース「Hetionet」は、28のパブリックリソースに置かれている薬物と遺伝子と疾患に関するデータを相互に結びつけたもので、数百万件の生物学研究から得られた知見が1つのネットワークにまとめられている。このデータベースを作ったペンシルベニア大学(米国フィラデルフィア)のデータ科学者Daniel Himmelsteinは、データベース構築のために研究者たちに連絡をとった際、研究者の何人かから「ネット上の公開データの再配布について許可を求められたことに驚いた」と言われた。オーストリア科学アカデミー分子医学研究センターのバイオインフォマティシャンJörg Mencheは、「公開しているデータのライセンスが問題になる場合があるとは、夢にも思いませんでした」と話す。

Mencheはすぐに利用を許可したが、誰もが彼のように協力的だったわけではない。ある研究グループは一度も返事をよこさず、別の3つの研究グループの返事には法的に不明瞭な点が残っていた。Himmelsteinは結局、彼が利用したかった公開データセットから再配布を明確に禁じていた1つを除いただけで、再配布に関する利用許諾がまだ明確でない3つを含めた状態でHetionetの最終版を2016年7月に公開した。難航した上、法的に不明瞭な状態を残してしまったのは、ネット上にデータセットを公開しただけでは第三者が合法的にそれを再配布できることにはならないことを、多くの研究者が分かっていないことにある、というのがHimmelsteinの見方だ。

科学者がネット上にデータセットを公開しても、その扱い方に法的に曖昧な点があると、第三者はそれらを有用なリソースとして活用することを躊躇する。そのため、科学の進歩の妨げになる恐れがあるとHimmelsteinは指摘する。科学者たちがネット上で公開する情報の量が増えるにつれ、この点はますます大きな問題になるだろう。「科学がデータの再利用に頼る割合はどんどん高くなっています」とHimmelstein。

データベース権

1つ1つのデータ(単なる事実)を著作権で保護することはできないため、多くの科学者は、アクセスに関する条件が明記されていないかぎり、公開されているデータセットは法的問題なしに再配布できると思っているかもしれない。けれどもノッティンガム大学(英国)の知的財産権制度の専門家Estelle Derclayeによると、そうとは限らないという。

データベースを作成するために行われた投資を保護するために、欧州連合(EU)は著作権とは独立に「データベース権」を認めている。EU加盟国の科学者によって作成されたデータセットをHimmelsteinのような研究者が再配布する際には、この権利が壁となる。

EU以外の国々では、データベース権の法的保護の手厚さにはばらつきがある。けれども、データベースを対象とする特別な権利が存在していない米国のような法域でさえ、判断に迷う場合がある。前述のとおり「事実」は著作権の対象にはならないが、データベースを作成する方法に十分な創造性がある場合には、著作権の対象になる可能性があるからだ。デジタル・キュレーション・センター(英国エディンバラ)の指針によると、「任意の状況におけるデータの利用法について、特に指定のない場合に法的にどのような立場をとるべきかを明らかにするのは難しい」という。

そのため、データ共有推進者は、公開データベースを作成する研究者に対し、第三者によるデータの再利用・再配布をどのように想定しているか、また、データベース権を放棄するか否かを明示することを勧めている。

合法か違法か

Himmelsteinのプロジェクトでは、彼が利用しようとしたデータセットのいくつかはライセンスが明示されていて、多くは無制限の再配布が可能であったが、それを禁止するものも一部あった。彼は作業中、第三者によるデータセットの再配布を許諾するかどうかを作成者が明確にしていないために良いデータが利用されずに終わってしまうのが何よりも歯がゆかったと言う。

ブリストル大学(英国)の知的財産法の専門家であるAndrew Charlesworthは、Himmelsteinが苦労することになった原因は、周囲に知的財産権制度について明確な助言ができる研究者がいなかったことにあるのかもしれないと指摘する。「法律上の疑問に答えられる仲間が誰もいないときに、『それなら自分が調べよう』と思う科学者は少ないのです」。

法律事務所Policy Bandwidth(米国ワシントンD.C.)に所属する弁護士で、知的財産法を専門としているJonathan Bandによれば、Himmelsteinがデータセットに付されている条件に違反しないかぎり、明確な許諾がなくても、Hetionetを発表することにより罰せられる可能性は低いという。ネット上でデータを公表する学者は通常、無料で自由に再配布されてかまわないと思って提供しているからだ。実際、Himmelsteinが行ったようなプロジェクトでトラブルになった人はまだいないという。

それでもHimmelsteinは、Hetionetが法律的に全く問題がないと断言する気にはなれず、このような曖昧さが、第三者による学術データの再配布を阻害しているのかもしれないと感じている。明確な許諾なしに商品開発を進めてしまうと、高くつく恐れがあるからだ。「ここはほぼ未知の領域だと思います。法廷闘争にでもなれば問題をはっきりさせられるのでしょうが、ほとんどの学者はそんなリスクを負える立場にありません」と彼は言う。

翻訳:三枝小夜子

Nature ダイジェスト Vol. 13 No. 11

DOI: 10.1038/ndigest.2016.161117

原文

Legal confusion threatens to slow data science
  • Nature (2016-08-04) | DOI: 10.1038/536016a
  • Simon Oxenham