News

TOOLBOX: ウェブ上の論文にメモを残せるツール

Nature ダイジェスト Vol. 15 No. 10 | doi : 10.1038/ndigest.2018.181027

原文:Nature (2015-12-01) | doi: 10.1038/528153a | Annotating the Scholarly Web

Jeffrey M. Perkel

複数の科学出版社が非営利組織Hypothes.isと提携して、科学者がウェブ上の研究論文にコメントを残せるシステムを構築しようとしている。

拡大する

ILLUSTRATION BY THE PROJECT TWINS

インターネット上の研究論文にメモや論評やコメントをつけやすくするソフトウエアがあったら、研究者はそうした「アノテーション」を行うようになるだろうか? 非営利スタートアップ「Hypothes.is」の設立者Dan Whaleyは、そうに違いないと考えている。

Hypothes.isは、ウェブ・アノテーションのためのオープンソース・ソフトウエア・プラットフォームを構築した(Hypothesis)。このツールを使えば、ユーザーはウェブ上の任意のページやPDFファイルに対し、テキストに印をつけたり、コメントを付記したりすることが可能になる。そして2015年12月1日には、ワイリー、CrossRef、PLOS、Project Jupyter、High Wire、arXivを含む40以上の出版社の他、テクノロジー会社や学術ウェブサイトとも提携関係を結んだと発表した。

この提携がきっかけとなり、世界中の研究者がウェブ上の論文にアノテーションを行うようになることを、Whaleyは期待している。科学者は研究論文にコメントをつけて公開または非公開で共有できるようになり、教師はアノテーションを利用して双方向的な授業ができるようになる、と彼は言う。熱心なファンは、このアイデアが軌道にのれば、ウェブ上の研究論文にアノテーションを行う仕組みが、論文の執筆や査読、出版の方法まで変えるかもしれないと考えている。

2011年に米国カリフォルニア州サンフランシスコで設立されたHypothes.isは、慈善団体から資金提供を受け、「世界中の知識について会話できるようにする」という大胆なミッションを掲げている。実は、ウェブ上のアノテーションという概念には、ウェブそのものと同じくらい長い歴史がある。ウェブページの読者にアノテーションを許可するというアイデアは1993年までさかのぼることができ、同年に公開されたウェブブラウザ「Mosaic」の初期バージョンにはアノテーション機能が付いていた。この機能は最終的には廃止されたが、今日でも、ブログプラットフォーム「Medium」、論文レファレンス管理システム「F1000 Workspace」、ニュースサイト「Quartz」など少数のウェブサイトが、デフォルトでページへのアノテーションを可能にするコードを挿入している。ただし、これらのアノテーションは当該サイトのユーザーにしか見えない。A.nnotateやGoogle Docsなど、他のアノテーション・サービスでは、アノテーションやコメントの共有を希望するユーザーは、クラウドコンピューティングサーバーにドキュメントをアップロードする必要がある。

ユーザーがウェブ全体に簡単にアノテーションを残せることを目的とするサービスは、Hypothes.isだけではない。競合するサービスとして、Genius社のウェブ・アノテーション・サービスがある。Genius社は、ラップの歌詞にアノテーションをつけるためのサイトとして始まったスタートアップ会社である。2015年4月、同社はユーザーが任意のウェブページにアノテーションをつけるのに役立つブラウザプラグインなどの提供を開始した。けれどもHypothes.isとは異なり、Genius社のコードはオープンソースではなく、そのサービスもPDFは対象外で、研究者コミュニティーとも連携していない。研究者寄りのサービスとしては、文献管理ツール「ReadCube」があり、ユーザーはReadCubeウェブリーダー上で読む論文のPDFにアノテーションをつけられるが、その機能を担うソフトウエアはプロプライエタリ(仕様が独自で非公開)である(なお、ReadCubeを所有するDigital Science社は、Natureの出版社を子会社に持つホルツブリンク・パブリッシング・グループが経営する企業である)。

一方、Hypothes.isのプラットフォームはオープンソースであるため、誰でもこれを利用して独自のアノテーションリーダーやライターを作成できる。標準化されたウェブ技術を使って誰でも独自のウェブブラウザを作れるのと同じである。Hypothes.isは、ウェブに用いる技術の標準化を推進する非営利団体ワールド・ワイド・ウェブ・コンソーシアム(World Wide Web Consortium;W3C)の作業部会のメンバーとして、アノテーションとその伝達方法のウェブ標準の策定に取り組んだ。理想は、アノテーションを行える全てのウェブページが同じ基本的なコードやプロトコルを採用することで(例えばハイパーリンクのように)、その機能を使いやすく、相互作用しやすくすることだ。作業部会は2017年2月にアノテーションのウェブ標準に関するW3C勧告を発表した。

Hypothes.isの使い方

Hypothes.isのユーザーがアノテーションを作成したり見たりするためには、ChromeウェブストアからHypothes.isの拡張機能を追加するか、ボタン型のブックマークレット(ブラウザのブックマークから起動する簡単なプログラム)をドラッグ・アンド・ドロップすればよい。

Hypothes.isのユーザーが(例えば学術論文の)ページを開くと、ウェブブラウザにユーザーがアクセスできるアノテーションが表示される。アノテーションは、テキストの上にハイライトされた文字やコメントとして現れる。ちょうど、テキストに透明なシートを重ねて、上から書き込みをしたような感じだ。ユーザーは、教科書にマーカーで印をつける学生のように、自分のコメントを追加することができる。これらはデフォルトでは公開だが、非公開にもできる。さらに、2015年11月3日のアップデートで、非公開のグループでアノテーションを共有できるようになった。論文抄読会や授業、ひいては査読にも利用可能である。

アノテーションが行われた後でページが変更された場合には、ソフトウエアは「ファジー論理」を使って、アノテーションを然るべき位置に対応付ける。このシステムは、HTMLのアノテーションをPDFに対応付けたり、元に戻したりすることもできる(例えば、ユーザーがウェブ版の論文にアノテーションを行った後で、同じ論文のPDF版を見る場合)。

アノテーションは専用のHypothes.isサーバーに貯蔵される。Whaleyは2015年に、ユーザー数1万、コメント数25万を達成するのは確実だと語った(現在、アクティブユーザーは毎月1万人以上、2018年4月末にはコメント数300万件を突破した)。例えば、2015年10月に大型ハリケーン「パトリシア」がメキシコを襲った後、気候科学者たちは、広く共有されていたmashable.comというニュースサイト上の記事にコメントしたり、テキストをハイライトしたりしていた(go.nature.com/rcsesf参照)。しかし、自社のコンテンツのアノテーションを管理したい出版社や、ファイアウォールの後ろで自社の文書にアノテーションを行いたい企業は、Hypothes.isを利用することで、同じソフトウエア・プラットフォームを使って自社のサーバーを運営できると、Whaleyは付け加える。

出版社との提携

Hypothes.isのユーザーはすでに、研究論文であろうと自分がアクセスできる有料閲覧記事であろうと、どのようなウェブページにもアノテーションを行うことができる。しかしHypothes.isと出版社が正式に提携したことにより、一部の出版社は、ページフレームやページ埋め込み型リーダーなど、アノテーションシステムをつまずかせるコンテンツの問題に取り組み、アノテーションの推奨に力を入れることになった。

例えば科学出版社eLife(英国ケンブリッジ)は、自社の査読コメントシステムの代わりにHypothes.isを利用する可能性を試験していると、同社の技術部門を率いるIan Mulvanyは言う。eLife社は、サイトをリニューアルする際に、現行のコメントシステムDisqusの代わりにアノテーション・プラットフォームを組み込むことを計画している。Mulvanyは、Hypothes.isを導入することで、最低でも、もっと的を絞り込んだ論評が可能になると主張する。ウェブページの一番下にあったコメントが、論文の本文に移動してくるからだ(eLife社は2018年1月にHypothes.isを導入した)。

さらに、コーネル大学図書館(米国ニューヨーク州イサカ)が運営するプレプリント・サーバーarXivの技術開発チームを率いる情報科学者のSimeon Warnerは、複数のバージョンの論文の間でアノテーションを流用できるようにしようと取り組んでいる。アノテーション・プログラムへの興味をかき立てるため、arXivは外部のブログポストでのarXivの論文への言及(トラックバック)をアノテーションへと変換し、Hypothes.isの使用中は論文のアブストラクトのページにアノテーションが見えるようにしている。

落書きで終わらせないために

Hypothes.isはプラットフォームの改良を計画している。その1つが、コメントをする人物の身元を確認することであり、研究者一人一人のORCIDデジタルプロフィールと紐付けることを考えている。arXivの設立者でコーネル大学の物理学者であるPaul Ginspargは、これにより、出版された論文に対する専門家の論評を容易にし、本質的でない書き込みを除外できるようになるため、学者によるシステムの利用を増やすのに大いに役立つだろうと考えている。「論文を読み始めて落書きのようなものが見えたら、コメントへの興味を失い、実験は失敗するでしょう」。

カーティン大学(オーストラリア・パース)の文化技術センターの研究チームのメンバーで、かつてPLOS社で働いていたCameron Neylonは、この試みが成功したら、ウェブ・アノテーションは学術コミュニケーションの方法を根本から変えるだろうと言う。

Neylonはこう説明する。現状では、学術出版のプロセスでは文書をあちこち行き来させなければならない。研究者は原稿を準備し、同僚と共有し、コメントを取り入れ、学術誌に投稿する。学術誌のエディターは査読者に原稿のコピーを送り、そのコメントを著者に送り、著者と編集者のやりとりの中でテキストを完成させる。論文が出版されると、今度は読者が論評してくる。

オープンソース・アノテーション・プラットフォームでは、文書が最大の関心事になると、Neylonは言う。コンテンツとそれに対するコメントにアクセスできる人を切り替えることで、異なる貢献者がコンテンツに作用することができ、文書は時間と共に充実してゆく。「コメントが、時間とバージョンの間を、これまでにないやり方で自由に行き来できる枠組みだと考えてください」と彼は言う。

しかしGinspargは、出版された論文にコメントをつける試みはこれまで何度も繰り返されてきたが、研究者たちは利用に消極的だったと指摘し、研究者が自分のコメントを非公開で共有できるようになったとしても、アノテーション機能を気に入るかどうかは分からないと言う。「人々が広くコメントする誘因構造が全然ないのです。思慮深いコメントを書くには時間がかかりますし、現状では評価されることもありません。それでも、この実験はやる必要があるのです」。

(翻訳:三枝小夜子)

キーワード

Nature ダイジェスト Online edition: ISSN 2424-0702 Print edition: ISSN 2189-7778

プライバシーマーク制度