News

TOOLBOX: 大学シラバスからデータを掘り出すツール

Credit: ILLUSTRATION BY THE PROJECT TWINS

論文やデータから、学会発表、講演まで、学者がインターネット上で公開している著作物から有益な情報を収集しようとする動きが広がっているが、ほとんど検証されてこなかったものが1つある。大学の教育課程で使用する読み物、授業で扱う内容、学生への期待などを記した文書「シラバス」だ。

2016年1月、そんな状況が一変した。コロンビア大学(米国ニューヨーク)のデータ科学者、社会学者、人文情報学研究者が、公開されている100万以上のシラバスを収集してデータベース化し、そのデータを検索しやすい形式で提供するオープン・シラバス・エクスプローラー(Open Syllabus Explorer)というツールを立ち上げたのだ。

このツールを開発したのは、オープン・シラバス・プロジェクト (Open Syllabus Project;OSP)というチームである。彼らは、各大学のシラバスがもっと公開されるよう促していきたいと考えている。シラバスが公開されることで、教科書の執筆者、教員、コース(科目)開発者の助けになるだけでなく、従来の大学教育では見落とされがちだった効果的な教材の設計を可能にすると期待しているからだ。

OSP諮問委員会のメンバーで、ハーバード大学オープンアクセスプロジェクトと同大学図書館学術コミュニケーション室(米国マサチューセッツ州ケンブリッジ)のディレクターであるPeter Suberは、「学者による著作物の中で、シラバスは、現時点では広く共有されていないものの、その必要のある重要な文書の1つです。どんなものなら教える価値があるかという学者の判断が反映されています」と話す。

そうした判断は、教科書の執筆者にとってはうれしいニュースになり得る。カリフォルニア大学バークレー校(米国)のコンピューター科学者Stuart Russellは、1995年にPeter Norvigと共著で上梓した『Artificial Intelligence(人工知能)』(プレンティスホール出版)という書籍が、コンピューター科学分野の教科書として最もよく指定されていることを、Natureからの取材申し込みの際に初めて知った。「全く予想外でした」と彼は言う。

OSPがもたらす情報は、プロフェッショナルのプライドをかき立てるだけでなく、終身在職権や昇進の判断材料にもなり得る。教科書の執筆は、それがどんなに便利で有益なものであっても、学術文献で引用されることはほとんどないのが普通であるため、学術的なインパクトは低い傾向がある。OSPは、このバランスを変えるのに役立つ可能性がある。マサチューセッツ工科大学出版局(米国ケンブリッジ)の局長Amy Brandは、「大学教員が自分の業績やインパクト、影響度の記録をもっと活用できるようにならなければならない時期に来ているのだと思います」と言う。シラバスの利用に関する信頼できるデータがあれば、大学教員は「自分の著作物が世間でどんな役割を果たしているかを語れるようになる」というのが彼女の考えだ。

現時点のオープン・シラバス・エクスプローラーは、2000年以降の100万以上のシラバスを検索し、2000万点以上の教科書との間で相互参照を行い、教科書としてシラバスで指定された回数に関するデータを提供している。ユーザーはこれらのデータを、執筆者、書名、大学名、分野によって検索できる。このツールは、特定の教科書と一緒に使用されることが多い教科書も教えてくれる他、各教科書がシラバスで指定された回数のランキングも提供している(「科学分野の人気教科書」参照)。

科学分野の人気教科書

OSPによると、科学分野で最もよく使用されていた教科書は以下の5冊だった。

教科書(著者) シラバス
Biology: Concepts and Connections (N. A. Campbell et al.)(原書は第11版。邦訳書『キャンベル生物学 原書9版』〈丸善出版〉) 2,196
Fundamentals of Anatomy and Physiology (F. Martini et al.) 752
Chemistry (R. Chang) 612
Human Anatomy & Physiology (E. N. Marieb and K. Hoehn) 605
Human Anatomy (E. N. Marieb et al.) 591

天文学・天体物理学、生物学、化学、コンピューター科学、地球科学、工学、心理学、社会科学 でフィルターをかけた結果。

SOURCE: OSP

オープン・シラバス・エクスプローラーは、近くアップデート版が公開される予定だ。アップデート版では、300万のシラバスと、プレプリントサーバーarXiv、論文リンキングシステムCrossRef、世界各国の国立図書館の同じ書誌情報を相互にリンクさせる「バーチャル国際典拠ファイル」のタイトルも含めた、約1億5000万点の教科書との相互参照が行えるようになる(註:アップデート版は2018年に公開予定と、OSPのウェブサイトで2017年9月に告知された)。OSPのプロジェクトディレクターJoe Karaganisによると、アップデート版には、年度や大学の種類などで検索できる機能など、新しい検索オプションが追加されるという。また、カナダと英国のデータを充実させたり、著作物を扱っている場所に関する情報を提供したりする他、将来的には、作成者の許可が得られたシラバスの全文を掲載していく予定である。

「私たちは目標を高く掲げています。現時点では全ての技術が未熟ですが、どれも改良できるものですし、データ科学は向上する一方です」とKaraganisは言う。

シラバスを収集する

OSPの拠点はコロンビア大学の公共政策研究機関であるアメリカン・アセンブリーにあり、スローン財団やアルカディア基金から資金提供を受けている。オープン・シラバス・エクスプローラーのヒントになったのはシラバス・ファインダー(Syllabus Finder)という検索エンジンで、設立された2002年から2009年まで、公開されていたシラバスを収集していた。このツールは、当時ジョージ・メイソン大学(米国バージニア州フェアファックス)の歴史学者で、現在は米国デジタル公共図書館のエグゼクティブ・ディレクターであるDan Cohen(2017年に退任し、現在はノースイースタン大学所属)によって作られた。Cohenによると、シラバス・ファインダーが収集したシラバスは約100万で、当時としては世界最大のコレクションだった。彼は2011年にこのURLをデータベースとして公開した。

シラバス・ファインダーは、個々のシラバスの全文へのリンクを提供していた。しかし、Cohenがシラバスを集めることができたのは2009年までであった。その頃、グーグルがプログラミング・インターフェースを変更したため、このツールは引退を余儀なくされたのだ。この変化は、幼児教育の専門家である彼の妻を含め、Cohenの同僚たちを悩ませた。「私の元にはいまだにシラバス・ファインダーを復活させてくれという電子メールが届きます」と彼は言う。

2014年にOSPが始動したとき、チームは、インターネット上のシラバスを探し出すツールを構築した。その中には、Cohenが利用していたリンク(データの一部はコーディングエラーのために失われている)も含まれている。けれどもCohenの場合と同じく、収集できるのは一般に公開されているシラバスだけだ。Karaganisの見積もりによると、米国内だけで約8000万~1億2000万のシラバスがあるはずだが、そのうち公開されているのは約600万だけであるという。「ブラックボード(Blackboard)」などのコース管理ソフトの壁の向こうに隠されたシラバスには、相変わらず手が届かない。「例えばコロンビア大学では、過去12、3年の間に8万のシラバスが作成されました。大規模な州立大学には、その2、3倍のシラバスがあるはずです」とKaraganisは言う。

OSPのチームは、シラバスに含まれている情報を抽出するためのツールも構築した。プロジェクトのテクニカルディレタクターであるDavid McClureは、「例えば、教材の列挙の仕方には一貫した構造がないのです」と言う。オープン・シラバス・エクスプローラーは、個々のシラバスを、ハーバード・ライブラリークラウドの1100万点とJSTORの900万点を合わせた2000万点の書籍のデータベースと突き合わせることで、書名を検索する。書名と著者名が一致した場合に教材として指定されたと判断するが、「著者名と書名の間に『by』が入ることを許容するなど、曖昧さを許容するための小技を組み込んであります」とMcClure。

影響度の新たな指標

OSPはこれらのデータから、特定の書籍がシラバスで教科書に指定される頻度を「1(ほとんど教えられない)」から「100(頻繁に教えられる)」までの数値で表す「ティーチング・スコア」という指標を抽出した。「私たちのティーチング・スコアは、オルトメトリクス(代替的指標)の1つとして、教科書の影響度の高感度な指標になると考えています」とSuberは話す。一部の研究者と大学は、まさにその用途でOSPのデータを利用している。ケンタッキー大学(米国レキシントン)は、同大学の教員Edward Morrisが執筆した教科書が1万3225冊の社会科学分野の教科書の中で46位になっていることを知って、2016年5月にプレスリリースを出した。現在は5万3177冊中371位だが、Morrisはこの数字を正教授への昇進の材料として活用したいと考えている。

OSPに注目しているのは米国の大学だけではない。Karaganisによると、OSPには毎日約1000回のアクセスがあり、そのほとんどは米国からだが、ウクライナ、ロシア、エジプトからのアクセスも多いという。

このデータを利用して、大学で広く教えられている劇画と漫画のリストを作成した研究者や、社会学の教科書に指定されている書籍の中で女性が執筆したものの割合を調べた研究者もいる。エール大学(米国コネティカット州ニューヘーブン)のポスドクMelanie Martinは、シラバス・エクスプローラーを利用して、自分が研究する進化人類学の分野で最もよく使用されている教科書を調べてみた。しかし、下位分野による絞り込み検索の機能がないため(例えば、生物学の検索結果を、神経科学やゲノミクスなどの下位分野に絞り込むことができない)、1万6000点の人類学の教科書を人力で調べなければならなかった。「フィルタリング機能をもっと改良しないと、あまり役に立たないと思います」と彼女は言う。

仲間の知識を利用する

OSPのデータのもう1つの用途はコース設計だ。大学の教員、中でも若手の教員が、仲間の知識を土台にしてコースを設計できるようになれば、教材を紹介する新しい方法を発見するなど、授業をよりクリエイティブに行えるようになる。他にも、コース設計の効率を良くし、教員が研究や指導など講義以外の活動により多くの時間を割けるようになるなどの利点がある。

しかし、イリノイ大学アーバナ・シャンペーン校の情報リテラシーの専門家Lisa Janicke Hinchliffeは、データを拡大解釈しないことが重要だと指摘する。このプロジェクトのサンプルは、全てのシラバスの代表例とみるには十分でない可能性があり、特定の大学という規模でさえそうかもしれないという。例えば、シラバス・エクスプローラーによると、ハーバード大学で2番目に多く教科書に指定されている書籍は、マーティン・ルーサー・キング・ジュニアの『Letter from Birmingham Jail(バーミンガム刑務所からの手紙)』である。Karaganisによれば、OSPが収集したハーバード大学のシラバスの約80%はハーバード大学ケネディー行政大学院のものであるという(ただし、OSPは通常はシラバスの入手先をここまで詳細には公表していない)。つまり、この教科書が実際にハーバード大学全体でどのくらい人気があるかを知ることはできないのだ。

Hinchliffeが考えるOSPの価値は、教員が授業に使用する著作物の範囲を明らかにできる点にある。「私が求めているのは、『上位6冊の教科書はこれです』という情報ではなく、多様性を見ることなのです」と彼女は言う。そうした情報は、手間暇がかかるコース設計の単純化に大いに役立つかもしれない。

21年間哲学を教えているSuberは、「新しいコースが始まることを知らされるたびに、少なくとも1年前から準備を始めるのです。40回の講義を準備するのは、本を書くよりはるかに大変です」と話す。

OSPのデータは、そうした負担を軽減するかもしれない。Suberはさらに、OSPのデータをあれこれ探るのは楽しく、時に予想外の組み合わせを教えてくれると言う。例えば、彼の法哲学の教科書『The Case of the Speluncean Explorers(洞窟探検隊事件)』(ラウトレッジ社、1998年)は、古代ギリシャの女性詩人サッフォーの叙情詩と一緒に教えられていた。「他にも、私が夢にも思わなかったような組み合わせ方があるのです」と彼は言う。

翻訳:三枝小夜子

Nature ダイジェスト Vol. 15 No. 2

DOI: 10.1038/ndigest.2018.180231

原文

Mining the Secrets of College Syllabuses
  • Nature (2017-10-31) | DOI: 10.1038/539125a
  • Anna Nowogrodzki