News in Focus

アフリカの言語で科学を論じる

Nature ダイジェスト Vol. 18 No. 11 | doi : 10.1038/ndigest.2021.211112

原文:Nature (2021-08-18) | doi: 10.1038/d41586-021-02218-x | African languages to get more bespoke scientific terms

Sarah Wild

一般的な科学用語の多くは、アフリカの言語で表記することができない。アフリカ各地の研究者たちが、そんな状況を変えようとしている。

ウガンダの首都カンパラの教育実習生。研究者たちは、東アフリカで話されているルガンダ(ガンダ)語などのアフリカの言語に科学用語を増やしたいと望んでいる。 | 拡大する

EYE UBIQUITOUS/ALAMY

ズールー語には「恐竜」を意味する独自の単語がない。「微生物」に対応する単語としては「amagciwane」があるが、「ウイルス」や「細菌」を個別に表す単語はない。「クォーク」は「ikhwakhi(クワ・キと発音)」と表すが、「赤方偏移」に相当する単語はない。南部アフリカでは1400万人以上がズールー語を使用しているが、ズールー語を話す研究者や科学コミュニケーターは、「進化」という言葉ですらどのような単語で表すべきかについて、意見の一致をみていない。

ズールー語は、アフリカで話されている約2000の言語の1つだ。現代科学はこれらの言語の大半を無視してきた。今、アフリカの研究者のチームが、そうした状況を変えようとしている。

「Decolonise Science(科学の脱植民地化)」と名付けられたこのプロジェクトでは、プレプリントサーバーAfricArXivに掲載されている180本の科学論文を、南部アフリカのズールー語と北ソト語、西アフリカのハウサ語とヨルバ語、東アフリカのルガンダ語(またはガンダ語)とアムハラ語というアフリカの6つの言語に翻訳することを計画している。これら6つの言語を話す人々は、合計すると約9800万人になる。AfricArXivは8月初旬に、自分の論文を翻訳してもらいたいと思う著者は、同月31日までに論文を投稿するようにと呼び掛けた。

翻訳される論文は、科学、技術、工学、数学の幅広い分野から選ばれる。このプロジェクトは、低・中所得国の研究者を対象とするデータ科学分野の資金配分機関「ラキューナ基金(Lacuna Fund)」の支援を受けている。ラキューナ基金は、欧米の慈善団体や政府の資金配分機関とグーグル社(米国カリフォルニア州マウンテンビュー)によって2020年に立ち上げられた。

取り残された言語

アフリカの言語に科学用語がないことは実社会に影響を及ぼしていて、特に教育現場においてその影響は顕著である。例えば南アフリカ共和国では、家庭内で英語を使用する市民は10%にも満たないのに、学校教育では主に英語が使用されており、学者たちはこれが科学や数学の学習の妨げになっていると指摘している。

機械学習とアフリカの言語の自然言語処理の専門家であるKathleen Siminyu(ケニア在住)は、アフリカの言語はオンライン革命から取り残されていると言う。「アフリカの言語は家庭で話すものと思われていて、教室でもビジネスの場でも使われません。科学の場においても同じです」。

Siminyuは、アフリカの言語の自然言語処理に関心を持つ研究者の草の根組織「Masakhane」のメンバーである。ズールー語で「共に築く」を意味するMasakhaneには、アフリカ大陸の約30カ国から400人以上のメンバーが集まって、3年前から一緒に活動している。このグループは、Decolonise Scienceの他に、ナイジェリアでのヘイトスピーチの探知や、アフリカの人名や地名を認識する機械学習アルゴリズムの教育など、数多くの取り組みを進めている。

Decolonise Scienceは、ゆくゆくは6つの言語のオンライン科学用語集を無償で提供し、これらを使って翻訳用の機械学習アルゴリズムを訓練することを目指している。だが、プロジェクトには高大な理想がある。それは、6つの言語のネット上の足場を強化することで、これらの言語が廃れるリスクを軽減することだ。研究者たちは、このプロジェクトを2022年初頭までに完了させたいと考えている。

専門用語を作る

南アフリカ共和国のヨハネスブルクを拠点とする機械学習の専門家Jade Abbottは、Decolonise Scienceでは翻訳者を雇用して、AfricArXivに掲載されている論文のうち、筆頭著者がアフリカ人のものを翻訳する予定だと説明する。論文で使われている用語に対応する単語が対象言語にない場合には、学術用語の専門家や科学コミュニケーターが新しい用語を考案できるように目印が付けられる。「書籍の翻訳とは違い、論文の翻訳では対応する用語があるとは限りません。これは新しい用語を作る作業なのです」とAbbottは言う。

ただし、「完全に新しい単語を作ろうということではありません」と補足するのは、このプロジェクトに参加している科学コミュニケーション企業ScienceLink(南アフリカ・ヨハネスブルク)のライターであるSibusiso Biyelaだ。「論文を読んだり用語を見たりした人が、最初から意味を理解できるようにしたいのです」。

ズールー語で科学に関する記事を執筆しているBiyelaは、既存の科学用語の語源となったギリシャ語やラテン語を調べて新しい用語を生み出すことが多い。例えば、英語の「planet(惑星)」は古代ギリシャ語の「planētēs(放浪者)」に由来している。惑星の動きが夜空を放浪しているように見えたからだ。そこでズールー語でも、惑星は放浪者を意味する「umhambi」と表記することにした。惑星を表すズールー語には「umhlaba」もあり、学生向けのズールー語の辞書にも掲載されている。しかし、「umhlaba」は「地球」や「世界」という意味の単語である。一方、説明的な用語もある。Biyelaは「化石」を「amathambo amadala atholakala emhlabathini(地中から見つかった古い骨)」という言い回しで表現している。

生物多様性研究のような科学分野では、研究者が適切な用語を見つけようとする場合、話し言葉での情報収集が必要になる。クワズール・ナタール大学(南アフリカ共和国・ダーバン)の言語計画・開発局の局長代理であるLolie Makhubu-Badenhorstは、文字としての科学用語はなくても、その言葉が存在していないとは限らないと言う。「あなた方の文化は書き言葉が中心になっていますが、私たちの文化は話し言葉が中心です。知識はあるのですが、十分に文書化されていないのです」とMakhubu-Badenhorstは言う。なお、彼女はDecolonise Scienceプロジェクトには参加していない。

Decolonise Scienceの学術用語の専門家は、ズールー語の科学用語を作るための枠組みを構築することになる、とBiyelaは言う。そして、完成した枠組みは、他の言語にも適用していくと続ける。

さらにチームは、その用語集を、ジャーナリストや科学コミュニケーターだけでなく、各国の言語委員会や大学や、自動翻訳サービスを提供する企業にも無償で提供する予定である。Biyelaはその理由を、「用語を作っても、他の人が使ってくれなければ、言語の中に浸透していきませんから」と説明する。

ビッグテック:「みなさんの力が必要です」

Masakhaneの研究者たちによると、歴史的にアフリカの言語を無視してきた世界のハイテク企業が、近年、この分野の研究に資金を提供するようになったという。

ビッグテックの1つであるグーグル社の広報担当者は、Nature の取材に対して、「私たちの翻訳ソフトが、アフリカに数千ある言語のうちのごく一部にしか対応していないことは認識しています」と回答している。その上で、トウィ語、エウェ語、バウレ語、バンバラ語、フラ語、カヌリ語、クリオ語、イソコ語、ルガンダ語、サンゴ語、ティブ語、ウルホボ語などのアフリカの言語を「グーグル翻訳」に追加したいと考えていると説明した。しかし、翻訳サービスの対象範囲を広げるためには、「これらの言語を話す人々の力を借りて、翻訳の質を向上させる」必要があると付け加えている。

グーグル社はアフリカの言語の翻訳の質を向上させるための助けを求めている。 | 拡大する

CRISTINA ALDEHUELA/AFP VIA GETTY

Biyelaは、「私たちが目指しているのは科学の文化的所有権です」と話す。彼もAbbottも、人々が自分たちの言語で研究したり科学について語ったりできるようにして、科学を脱植民地化することが重要なのだと主張する。現在、アフリカの言語を使って政治やスポーツについて語ることはできるが、科学について語ることはできないとBiyelaは言う。

南アフリカのエテクウィニ都市圏で復元生態学・環境計画・気候保護プログラムマネジャーを務めるBheka Nxeleは、環境スチュワードシップ(自然環境の責任ある利用と保護という考え方)や環境保護の分野でも主に英語が使われているが、人々が具体的な用語や概念の意味を母国語で理解し、それについて語ることができなければ、生態系や種の保存に向けた政府の取り組みが自分たちにも関係あるものであるとは感じられないだろうと話す。

研究者たちは、アフリカの言語がネット上のアルゴリズムに含まれていなければ、いずれ時代遅れになり、忘れ去られてしまうのではないかと懸念している。「アフリカの言語は話し言葉です。今もアフリカの人々は日常的に自分たちの言語を使用しているのに、デジタルフットプリントがないという理由で、将来、失われてしまうかもしれないのです」とSiminyuは語る。

(翻訳:三枝小夜子)

キーワード

Nature ダイジェスト Online edition: ISSN 2424-0702 Print edition: ISSN 2189-7778

プライバシーマーク制度