News in Focus

ヒトゲノムの完全解読は近い:ギャップはいかにして埋められたか

Nature ダイジェスト Vol. 18 No. 9 | doi : 10.1038/ndigest.2021.210904

原文:Nature (2021-06-04) | doi: 10.1038/d41586-021-01506-w | A complete human genome sequence is close: how scientists filled in the gaps

Sara Reardon

解読済みのヒトゲノムに、新たに2億塩基対と115の遺伝子が加わった。まだ残っているのは、Y染色体の解読だ。

拡大する

TEK IMAGE/SCIENCE PHOTO LIBRARY/Science Photo Library/Getty

解読完了に近づくヒトゲノム
研究者たちはこの20年間、ヒトの参照ゲノム配列の未解読部分をこつこつと埋めてきた。今、その作業はほぼ完了し、30億5000万塩基対のヒトゲノム配列が解読された。

配列の0.3%にはエラーがあるかもしれない。X染色体は含まれているが、Y染色体は含まれていない。ミトコンドリアDNA は数に入っていない。 | 拡大する

SOURCE: ADAM PHILLIPPY

今から20年前に、ヒトゲノム計画(Human Genome Project)とバイオテクノロジー企業セレラ・ジェノミクス社(Celera Genomics)がヒトゲノムの塩基配列を発表した。だが、その配列は完全なものではなく、全長の約15%が欠けていた。技術的な限界から、ある種のDNA領域、特に、文字(塩基対)の繰り返しが多い部分がどのように組み合わさっているのかを明らかにすることができなかったのだ。こうした問題の領域の一部は、研究者たちのその後の努力により解読することができた。しかし、遺伝学者たちが2013年から参照配列としている最新のヒトゲノム配列でさえ、全長の8%が欠けている(図「解読完了に近づくヒトゲノム」 参照)。

このたび、30の研究機関からなる「テロメア・ツー・テロメア(Telomere-to-Telomere;T2T)コンソーシアム」の研究者たちが、そのギャップを埋めた。カリフォルニア大学サンタクルーズ校(米国)のゲノミクス研究者であるKaren Migaらが、5月27日に発表したプレプリント論文「The complete sequence of a human genome(ヒトゲノムの完全配列)」において、これまで解読されていなかった塩基配列を決定し、タンパク質をコードする遺伝子を新たに115個ほど発見して遺伝子の合計は1万9969個になったと報告したのだ(S. Nurk et al. Preprint at bioRxiv https://doi.org/gj8jk3; 2021)。

国立生物工学情報センター(NCBI;米国メリーランド州ベセスダ)のバイオインフォマティクス研究者であるKim Pruittは、「問題の領域について決着がついたのは、非常に喜ばしいことです」と語り、今回の結果は「重要な節目」となると評価する。

今回決定されたゲノム配列は、T2T-CHM13と命名された。2013年に発表され、これまで参照配列として利用されてきたゲノム配列(GRCh38)に、新たに2億塩基対近くが加えられたことになる。

研究者たちは今回、1人の生きている人間からDNAを採取するのではなく、ヒトの全胞状奇胎(核のない卵子に精子が侵入したときに精子の核のみで発生する組織)に由来する細胞株を使用した。この細胞には父親に由来する染色体しか含まれていないため、2人の別々の人間に由来する2組の染色体を区別する必要がない。

今回の偉業は、パシフィック・バイオサイエンス社(Pacific Biosciences;米国カリフォルニア州メンロパーク)が開発した新しい塩基配列決定技術がなければ成し遂げられなかっただろうと、Migaは言う。この手法では、レーザーを使うことで、細胞から分離した長いDNAを一度に2万塩基対もスキャンすることができる。従来の塩基配列決定法では、一度に数百塩基対のDNAしか読み取ることができず、研究者たちはこうした断片をパズルのピースのように組み合わせていた。断片が大きくなれば、重複した配列が含まれている可能性が高くなり、それらを組み合わせるのは格段に容易になる。

しかし、T2T-CHM13もヒトゲノム配列の決定版ではない。研究チームはいくつかの領域の解読にてこずり、ゲノムの約0.3%にエラーがあるかもしれないと考えている。ギャップはないが、こうした領域では品質管理のチェックが困難だったとMigaは言う。また、胞状奇胎を形成した精子細胞が持っているのはX染色体であるため、一般に男性の生物学的発生を誘発するY染色体の塩基配列はまだ決定できていない。

T2T-CHM13は1人の人間のゲノムにすぎない。しかし、T2Tコンソーシアムは、今後3年間で世界中の人々の300以上のゲノム塩基配列を決定することを目指している「ヒト・パンゲノム・リファレンス・コンソーシアム(Human Pangenome Reference Consortium)」という団体と提携している。Migaによると、両チームはT2T-CHM13を参照配列とすることで、ゲノムのどの部分に個人差が生じやすいかを理解できるようになるという。両チームはまた、両親からの染色体を含むゲノム全体の塩基配列の決定も計画している。さらにMigaのグループは、ギャップを埋めるために、同じ新しい手法を使ってY染色体の塩基配列を決定することにも取り組んでいる。

Migaは、遺伝学研究者たちが、新たに塩基配列が決定された領域や遺伝子と思われる領域がヒト疾患と関連しているかどうかを、速やかに明らかにすることを期待している。「最初にヒトゲノムが発表されたときには、すぐに使えるツールはありませんでした。けれども今は、膨大なリソースが蓄積されています」と彼女は言い、新たに塩基配列が決定された遺伝子の機能に関する情報は、以前に比べはるかに速く得られるはずだと予想している。

Migaは、将来のヒトゲノム配列が、読み取りやすい部分だけでなく、今回新たに配列が決定された部分も含めて、全てをカバーしたものになることを望んでいる。参照ゲノムが完成した今、これは容易になるはずだ。「ゲノミクスは新たな基準に到達する必要があります。これは特別なことではなく、ごく普通のことなのです」と彼女は言う。

(翻訳:三枝小夜子)

キーワード

Nature ダイジェスト Online edition: ISSN 2424-0702 Print edition: ISSN 2189-7778

プライバシーマーク制度