News

血縁情報を利用した捜査にプライバシー上の懸念

法執行の手が伸びる範囲は広く、今や我々のDNAにまで及ぶこともあり得る。 Credit: RICK BOWMER/AP/SHUTTERSTOCK

1970年代半ばから1980年代後半にかけて米国カリフォルニア州で起きた一連の強盗、婦女暴行、殺人事件は、1人の正体不明者によるものとされ、その犯人はゴールデンステートキラー、あるいはイーストエリア・レイピストと呼ばれた。この忌まわしい事件の容疑者が2018年、逮捕された。その原動力となったのは、遺伝情報を利用した犯罪捜査技術であった。この捜査方法が大幅に威力を増しつつあることを示唆する2編の論文が、2018年秋に発表された1,2

両論文は、既存の科学捜査データベースの個人識別能力の規模は大幅に拡大し続けていて、犯行現場のDNAに関してほぼ全ての欧州系米国人とのつながりを探ることが間もなくできるようになる可能性がある、と結論付けている。つまり、これらの研究結果は、切迫したプライバシー問題を提起している。「この議論を早期に行うことが重要だ」。一般消費者向け遺伝子検査サービスを提供するマイヘリテージ社(MyHeritage;イスラエル・ヤフーダ)の最高科学責任者で、一方の研究1を率いたYaniv Erlichはそう話す。

ゴールデンステートキラー事件の捜査は難航していた。だが2018年4月、警察はジョゼフ・ジェームズ・デアンジェロを逮捕した。デアンジェロを容疑者として特定するに至った決め手の1つは、遺伝情報に基づいてウェブ上で家系図を作成できるサイト「GEDmatch(ジェドマッチ)」に登録された、彼の遠い親類の遺伝子プロファイルであった。これが、犯行現場のDNAと符合したのだ。GEDmatchでは、一般消費者向け遺伝子検査サービス企業から得たデータをアップロードして親類を探すことができる。

この捜査方法は、広域家系調査(long-range familial search)として知られ、この手法で2018年4〜8月の間に十数件の事件が解決されている。Erlichらは、この方法の個人識別能力の範囲を明らかにしようと、評価に取り掛かった。研究チームはまず、マイヘリテージ社の顧客128万人のDNAプロファイルを匿名化して解析した。同社も、共通の先祖から受け継いだDNAを共有する親類を探すサービスを顧客に提供している。

調べた結果、マイヘリテージ社の顧客の60%で、データベース上に「みいとこ(曾祖父母のきょうだいの子)」またはそれ以内の親類が存在することが判明した。無作為に選んだGEDmatchのプロファイルを30件調べても、親類のマッチング率は同等だった。

しかし、こうしたDNAデータベースの威力は登録者の特定にとどまらない。それ以上に多くの未登録者を特定できる可能性を秘めていて、実際、デアンジェロはGEDmatchに登録されていなかったにもかかわらず、捜査チームはみいとこのプロファイルを使って彼を発見している。Erlichらの推測では、欧州系米国人300万人の遺伝子プロファイルが登録されたデータベースがあれば、公開されている家系記録を利用して、欧州系米国人集団の90%が特定可能になり得るという。GEDmatchは、共同管理者のCurtis Rogersによれば、プロファイルが1日当たり1000~2000件増加しており、今後数年で300万件に到達する見込みだ。

データベース未登録者の追跡が可能かどうかを調べるため、Erlichらは、1000ゲノムプロジェクトの一環としてDNAが公開されている米国ユタ州の匿名女性を突き止められるか試みた。その女性のプロファイルをGEDmatchにアップロードし、遠縁の親類を検索すると、その女性から数世代さかのぼった先祖が共通であることを示唆するのに十分なDNAの特徴を共有する人々を発見した。そのうち2人については、検索結果を絞り込むのに十分な血縁情報が公開されていた。研究チームは1日かけて数百人の子孫をふるい落とし、ついにユタ州の女性を突き止めた(女性の氏名は論文に記されておらず、研究チームは本人との接触を図ることもしていない)。

情報の発見

ゴールデンステートキラー事件で容疑者を特定できたのは、犯行現場のDNAがきちんと保存されていたからに他ならない。そのおかげで科学捜査チームは、一般消費者向けの遺伝子検査や多くの生物医学研究で現在利用されている手法、すなわち、ゲノムに広がる数十万種類のバリアント(多様体とも呼ばれる)や一塩基多型(SNP)の塩基配列解読を用いることができた。

対照的に、過去数十年の犯行現場DNAは、「短い縦列反復配列(short tandem repeat;STR)」という十数回以上の反復がある配列を利用することで解析されたものが大多数だった。米国連邦捜査局(FBI)のCODIS(Combined DNA Index System)には、そうしたプロファイルが1300万件以上保存されている。スタンフォード大学(米国カリフォルニア州)の集団遺伝学者Noah Rosenbergによれば、これによって科学捜査チームは個人の遺伝的特徴を判定することができるが、それは親類のマッチングにはあまり適していないという。その対策としてRosenbergらは、CODISのプロファイルと近縁者のSNPプロファイルとをコンピューター上で相互に結び付ける方法を開発した。シミュレーションの結果、STRを利用してDNA型鑑定が行われた人の約3分の1は、SNPでDNA型鑑定が行われた一親等者と正確にマッチングされることが示唆された2。この技術により、犯行現場の材料からSNPプロファイルが得られなくても、GEDmatchなどのデータベースでCODISプロファイルと合うものを探せるようになるかもしれず、またその逆も可能になるかもしれないとRosenbergは説く。

ゴールデンステートキラー事件のような血縁情報を利用した捜査は増える方向だ。サンフランシスコ州立大学(米国カリフォルニア州)の統計遺伝学者Rori Rohlfsは、そのような捜査に歯止めがないのは問題が大きいと語る。しかし、一定のルールは存在する。例えばカリフォルニア州では、親類捜しに法執行による科学捜査データベースの利用が可能なのは、公衆安全に対する危険を有する深刻な犯罪の場合に限られ、また血縁情報捜査チームは、事件を担当する地元の捜査チームとは別のものでなければならないと定めている。

Erlichによれば、一般消費者向け遺伝子検査サービス企業はダウンロードされるデータファイルにデジタル署名を付すことができるため、GEDmatchはそのデータを捜査チームによりアップロードされた犯行現場のプロファイルと区別して、一般消費者を捜査から保護することができるという。Rogersは、GEDmatchには法執行によるアクセスを制限する計画がないと話し、利用を規制すれば、親類の発見支援という同サイトの目的を妨げることになると懸念する(ゴールデンステートキラー事件が持ち上がった後、GEDmatchはサービス利用規約を改定し、捜査機関がこのサイトを利用する可能性についてユーザーにはっきりと警告している)。「プライバシーが侵害されている人はいないと思います」とRogersは語る。「DNAを管理することができるのは本人であって、政府の自由にさせてはいけません」。

血縁情報データベース検索を利用して数々の行方不明者事件の解決を支援してきたDNA Doeプロジェクト(米国カリフォルニア州セバストポル)の共同事務局長Colleen Fitzpatrickは、そうした血縁情報捜査で集められる情報は他の手掛かりとそれほど違いがないため、取り扱いを区別するべきではないと話す。「個人のどんな行動も、他者に関する情報を明かしてしまうのですから」とFitzpatrickは語る。

翻訳:小林盛方

Nature ダイジェスト Vol. 16 No. 1

DOI: 10.1038/ndigest.2019.190110

原文

Supercharged crime-scene DNA analysis sparks privacy concerns
  • Nature (2018-10-11) | DOI: 10.1038/d41586-018-06997-8
  • Ewen Callaway

参考文献

  1. Erlich, Y., Shor, T., Pe’er, I. & Carmi, S. Science https://doi.org/10.1126/science.aau4832 (2018).
  2. Kim, J., Edge, M. D., Algee-Hewitt, B. F. B., Li, J. Z. & Rosenberg, N. A. Cell https://doi.org/10.1016/j.cell.2018.09.008 (2018).