News

無料で使える科学論文の評価指標ツール

Nature ダイジェスト Vol. 8 No. 11 | doi : 10.1038/ndigest.2011.111114

原文:Nature (2011-08-04) | doi: 10.1038/476018a | Computing giants launch free science metrics

Declan Butler

巨大IT企業グーグルとマイクロソフトの新サービスは、論文引用データやその評価指標を無料で提供する。

科学全体の見取り図を、より簡単に把握できる日が近づいている。グーグル社とマイクロソフト社が、引用文献データツールを無償で提供し始めたからだ。

有料の評価指標プラットフォームとしては、すでに、トムソン・ロイター社のWeb of Knowledgeやエルゼビア社のScopusデータベースがある。しかし、グーグル社とマイクロソフト社のツールは無料なので、使用料が支払えない(あるいは支払いたくない)科学者や研究機関にとって、まさに朗報となるはずだ。

グーグル社のGoogle Scholarは、2004年に学術出版物の検索エンジンとしてスタートし、2011年7月からGSC(Google Scholar Citations)が加わった。これによって、研究者は、Google Scholarデータベースに登録された自身のすべての論文を表示した、個人プロフィールを作成することができる(go.nature.com/7wkpea)。このプロフィールには、これらの論文の被引用回数の推移を示したグラフをはじめ、科学者の生産性やその論文が与える全体的影響を測定するための引用評価指標(例えば、高い人気を誇るh指数)が示されている。現在、このサービスは、招待者のみが利用できるベータテスト段階にあるが、最終的には、すべての研究者が利用できるようにする計画だ。

拡大する

SOURCE: C. BERGSTROM & J. WEST/MAPEQUATION.ORG

一方、2009年に始動したMAS(Microsoft Academic Search)にも、GSCとよく似たツールが付いており、この数か月の間に、引用評価指標をベースとした新しいツールがいくつか加わった(go.nature.com/u1ouut)。これらのツールを使うと、引用ネットワーク(右図参照)、出版物のトレンド、各分野の一流研究者のランキングが手に入る。

機能の数としては、マイクロソフト社のプラットフォームのほうがずっと多い。しかし、現在のところ、Google Scholarの規模の優位性が非常に大きく、そちらの評価指標のほうがはるかに正確で信頼性が高い、と研究者は話す。Google Scholarに登録されている文献の数は、マイクロソフト社はもちろん、Web of KnowledgeやScopusよりもはるかに多い。これに対して、MASに表示される著者の出版物はほんの一部にとどまることが多く、そのため、引用評価指標が「異様に低い」値になっている、とハワイ大学(米国ホノルル)の情報科学者Péter Jacsóは話す。

「MASは、商品としてはまだ生まれたてなのです」とMicrosoft Research Connections社の教育・学術コミュニケーション担当ディレクターLee Dirksは遅れを認める。ただ、MASへの登録文献は、2011年3月から6月の間に1570万点から2710万点に急増し、今後もこのペースを維持するそうだ。「MASには大きな潜在力がある」とメルボルン大学(オーストラリア)のAnne-Wil Harzingは話す。彼女はGoogle Scholarから引用評価指標を抽出するツールを開発した人物だ。

一方で、こうした手法自体に疑問を投げかける研究者もいる。人手によるデータの整理・確認作業を行わずに、本当に、純粋に計算的な手法によって信頼性の高い書誌データベースと引用評価指標を生み出せるのか、という疑問だ。Jacsóは、MASとGSCで用いられているテキストマイニングソフトウェアが、出版物から誤った書誌情報を抽出することが時々起こる点を指摘する。例えば、著者名や所属機関の誤認などだ(P. Jacsó Online Inform. Rev. 34, 175–191; 2010)。

Google Scholarやその新しい評価指標システムの開発に携わったグーグル社のAnurag Acharyaは、これに反論する。同社はこうした問題に長い間取り組んできており、最近の一連の改良により、同社のシステムの性能は「ますます向上している」と話す。またHarzingは、批判的な論者がこうした極端な書誌的誤りをことさら強調することが多い、とも付言する。彼女は、Google Scholarにおける全体的な誤りのレベルはかなり低く、h指数など、もっとエラーに強い評価指標の計算精度には大きな影響は与えないと推測している。

Google Scholarは、社会科学と人文科学の分野で特に重要な研究成果物である書籍や、コンピューターサイエンスや工学分野の重要な成果物である会議要旨録(proceedings)を広範にカバーしている。この点でも有料データベースより優位性がある。「こうした文献までカバーしていることは、正確な評価指標を作り出すうえで非常に重要です」とライデン大学科学技術研究センター(オランダ)に所属する書誌計量学の専門家Ton van Raanは言う。トムソン・ロイター社の商品開発担当ディレクターJoel Hammondは、Web of Knowledgeもすでに会議要旨録の文献登録を始めており、今秋には書籍についても始めると言っている。Scopusにも類似の計画がある。

ただし、MASとGSCのいずれも、自分たちがWeb of KnowledgeやScopusと直接競合するとは考えていない。「これは、他社と競争するという話ではありません。学術研究のためのオープンプラットフォームを提供しようという問題なのです」とDirksは話す。また、インド生まれのAcharyaは、これまではお金持ちの研究機関だけが利用できたサービスを、誰もが利用できるようにするという人道的な目標が動機となって行動している、と語る。実際、Google Scholarのサーバーのログには、貧困国の研究者が幅広く利用していることが示されており、Acharyaはこれに満足していると話す。

守る側のHammondは、「トムソン・ロイター社は、無料サービスと比べて、登録する出版物の選定管理をより厳密に実施しており、それが、同社の評価指標計算の信頼性を高めている」と主張する。Scopusも同様の方針をとっている。しかし、ほかの論者は、最終的には、GSCとMASが多くのユーザーにとって十分な内容を備えることになるだろう、と話している。「GSCとMASには、誰でも無料という決定的な強みがあり、今後開発が継続されれば、有料製品の本格的な競争相手になると思います」。こう話すのは、ワシントン大学(米国シアトル)の生物学者で、引用データの解析でMicrosoft Research Connections社、トムソン・ロイター社の両社と共同研究を行ったことのあるCarl Bergstromだ。

van Raanもこれと同じ考えで、「文献引用インデックスを提供する営利企業が、今後ますますこうした無料アクセスサイトの蚕食を受けるのは明白です」と話している。

(翻訳:菊川要)

キーワード

Nature ダイジェスト Online edition: ISSN 2424-0702 Print edition: ISSN 2189-7778

プライバシーマーク制度