News

ウィキペディアで最も引用された論文

Nature ダイジェスト Vol. 15 No. 8 | doi : 10.1038/ndigest.2018.180812

原文:Nature (2018-05-17) | doi: 10.1038/d41586-018-05161-6 | Wikipedia’s top-cited scholarly articles — revealed

Giorgia Guglielmi

DOI付きの論文についてウィキペディアでの引用回数を調べたところ、引用ランキング上位の論文の多くは遺伝子研究関連であった。

拡大する

Jaap Arriens/NurPhoto via Getty Images

インターネット百科事典の1つ、「ウィキペディア」上での引用回数が特に多い学術論文は、月のクレーターの名称や遺伝子の塩基配列に関するものであり、その大半の引用回数は、科学文献での引用回数よりも多いことが明らかになった。米国ニューヨークを拠点とするデータ科学者で、司書でもあるMatt Millerは、「引用回数が多い論文の大半が科学論文であることは非常に意外でした」と言う。

Millerは、ウィキペディアを運営する非営利組織ウィキメディア財団(Wikimedia Foundation ;米国カリフォルニア州サンフランシスコ)が2018年3月に公開した引用データを分析した。このデータは、300近い言語で展開されているウィキペディアの全ての言語版において、ISBN(国際標準図書番号)やDOI(デジタルオブジェクト識別子)などの出版物を識別するための国際コードを付与された文献が何回引用されているかを示すもので、記録の数は約1570万件に及ぶ。

ウィキペディア上で識別子を使って引用された出版物のほとんどは書籍だが、Millerは英語版ウィキペディアで、学術論文の識別子として最も広く使われているDOIが付与された出版物の数を調べた。彼が収集したデータにはDOIを使った引用が120万件含まれていて、引用された論文は83万5000編以上に上る。

英語版ウィキペディアで最も多く引用されている学術論文は、ヒトとマウスの遺伝子の配列を1万5000以上集めた2002年の論文で、引用回数は4702回だった。この研究を引用しているウィキペディアのページの多くは、個々の遺伝子またはタンパク質に関する項目である。上位10編の論文のうち5編がDNAカタログに関するものだった(ウィキメディア財団のブログにも、「予想していたことだが、ウィキペディアンはデータベース的な論文が大好きなのだ」と書かれている)。

上位10編の論文には、恒星までの距離や小惑星、月のクレーターの名称などに関する4編の天文学分野の論文も含まれている(Google Scholarによれば、月のクレーターの名称に関する1971年の論文は、科学文献ではわずか16回しか引用されていない)。

ロンドンを拠点とする慈善財団アルカディア・ファンド(Arcadia Fund)のオープンアクセスプログラムを指揮するRoss Mounceは、今回の研究とは独立に、ウィキメディアのデータのより広範な分析を行い、ウィキペディア全言語版総計で最も引用回数が多いDOI付き論文を明らかにしている(「ウィキペディアでの引用回数が多い学術論文」参照。完全なリストはgo.nature.com/2gfnfuiを参照)。上位10編のうち6編は英語版と同じだったが、第1位は全く異なる論文だった。それは世界の気候に関する2007年の論文で、ウィキペディア全言語版総計での引用回数が280万回であるのに対し、英語版ウィキペディアでは、わずか169回だった。

この論文の引用回数がこれほど多いのは、ボット、つまりウィキペディアの項目を自動的に作成するコンピュータープログラムによって数百万件の引用が行われているからだ。ウィキペディアによれば、このボットはダーラナ大学(スウェーデン・ファールン)の物理学者Sverker Johanssonが開発したもので、2014年7月の時点で300万近い項目を作成していたという。項目の3分の1はスウェーデン語で書かれていて、その多くが山や河川などの地理的な場所に関するものであり、残りの3分の2は、いずれもフィリピンで話されているセブアノ語とワライ語で書かれている。

カリフォルニア大学キュレーションセンター(米国)の所長でバークレーを拠点とするJohn Chodackiは、「この情報を入手できたこと自体が非常に興味深いことなのです」と言う。歴史的に、学術論文の引用データの分析と比較は、有料サービスを利用しないかぎり不可能だからだ。

ウィキペディアでの引用回数が多い学術論文

全言語版ウィキペディアで最も多く引用されたDOI付き学術論文トップ5
283万341回 「ケッペン–ガイガーの気候区分地図、改訂版」(2007年)
2万1350回 「断片法を用いた小分子の疎水性(親油性)の予想」(1998年)
2万247回 「NIHの完全長cDNAプロジェクト:哺乳類遺伝子コレクション(MGC)の現状、品質、拡張」(2004年)
5937回 「ヒトおよびマウスの1万5000以上の完全長cDNA配列の生成および初期分析」(2002年)
5854回 「アジアーゴ超新星カタログ、10年ぶりの改訂版」(1999年)

(翻訳:三枝小夜子)

Richard Van Noordenによる追記あり

キーワード

Nature ダイジェスト Online edition: ISSN 2424-0702 Print edition: ISSN 2189-7778

プライバシーマーク制度