Japanese Author

次世代シーケンサーで、研究も医療も変わる!

ゲノム配列を高速で解読できる次世代シーケンサーが米国などの数社から製品化され、さまざまな基礎研究や応用分野で活発に使用されるようになってきた。この装置で具体的にどんなことが可能なのか、ゲノム解析技術の開発や整備に長年関わってきた東京大学の菅野純夫教授と、次世代シーケンサーを使った研究成果を次々と発表している京都大学の小川誠司教授に、医学や医療の分野を中心に話を聞いた。

–– 2003年に完了したヒトゲノム計画で使用されたのは第1世代のシーケンサー。そして、現在出回っているのは「次世代型」。両者の違いは？

菅野： DNAの塩基配列を解読する装置をシーケンサーと呼びますが、第1世代と次世代型では、DNAの処理スピードが全く違います。ヒトゲノムを解読するのに、第1世代では3年以上を要したのですが、次世代型ではわずか6日程度でできるのです。

小川：私は、もともとは血液内科医で、がんの研究をしてきました。がんはゲノムの変異により引き起こされる病気なのですが、2000年代初頭に、患者さんのゲノムを網羅的に調べる方法はないかといろいろ模索していたのです。2005年、京都で開かれた国際ヒトゲノム会議で、米国のベンチャー企業ソレクサ社の若い人が当時開発中の次世代シーケンサーについて発表しているのを聞き、感心しました。

長いゲノム配列を25塩基ずつに切断して読み、ヒトゲノムの参照配列と比較すれば、その25塩基の位置を決めることができる。そこで、25塩基を200万個読めば、ヒトゲノムの相当部分が読破できる。塩基の解読は、一塩基ずつが発する光を写真に撮って検出する、といった斬新な仕組みなのです。これが実用化されればゲノム配列を直接解読できると期待が膨らみました。ソレクサ社はその後イルミナ社に買収されて、イルミナ社から現在主流の次世代シーケンサーが発売されたわけですが。

菅野：小川さん、そんなに早くから注目していたの？　すごいな。

実際に市販されたのが、2年後の2007年。その年に、私が所属する東大は、日本の1号機を入手しました。市販後も、「次世代」という名称が使われ続けています。

全ゲノム解読が爆発的に進む

–– その後、次世代シーケンサーを用いた生物･医学研究が爆発的に活発化しました（図1）。

小川：翌年の2008年には、ワシントン大学の研究グループが白血病患者の全ゲノム配列を解読し、Natureに発表しました¹。それを見て感銘を受けました。

菅野：あれは驚きました。

小川：実は次世代型といっても、当時の装置は25塩基ずつしか読めないわけですから、その後の計算処理が大変でした。だから、あの論文の解析結果には誤りも多かった。でも、未来を指し示す論文だったと思うのです。次世代シーケンサーが医学研究の新たな世界を切り開いていくという……。

菅野：医学だけでなく、理学、農学、薬学、環境学など生命科学全般に大きな影響力を与えていますよ。

小川：そして、がんの分野でいえば、TCGA（The Cancer Genome Atlas；がんゲノムアトラス）やICGC（国際がんゲノムコンソーシアム）などの世界的なプロジェクトから、がんゲノム（がん患者の生殖細胞やがん組織の）を解読した論文が次々と発表されました。その勢いは現在まで、衰えることを知りません。

菅野：次世代シーケンサーの性能はその後も向上し続け、配列解析のコストを10分の1に下げるという目標の下、技術革新が続きました。現在、コストは6分の1程度にまで下がっています。

–– 次世代シーケンサーで調べる配列には、どのようなものがありますか？

菅野：ヒトゲノムは30億塩基対ありますが、それら全部（全ゲノム）を調べる方法の他に、遺伝子の配列（エクソーム）だけを調べる方法もよく使われます。また、特定の遺伝子領域だけを標的に網羅的に解読することもあります。

ゲノムDNAから転写されて作り出されたRNAを解読して、遺伝子発現を調べることも可能です。RNAの場合は、相補的なDNA配列に変換してから配列解析します。それから、免疫沈降反応を利用したChIP-seqという方法で、クロマチンのメチル化修飾をゲノムワイドに調べることも可能です。

–– 次世代シーケンサーで解析する内容も多彩ですね。

小川：生まれながらに持っている変異、体細胞で新たに起こった変異、あるいはがんの経過を調べるなど、さまざまなことに利用可能です。

菅野：最近では米国の研究グループが、非小細胞肺がんの患者の血中腫瘍DNA量を調べることで、がんの検出ができる可能性なども報告していますね²。

–– DNA診断など、医療への応用も進むのでしょうか。

小川：つい最近聞いた話なのですが、米国の聖ジュード小児研究病院では、今後、入院患者全員のゲノム配列を解読していくことを決定したそうです。

菅野：いよいよ実施ですか。配列解読は外注するのかな？

小川：詳細はまだよく分からないです、1人1人のゲノム配列には多様性があるので、得られたゲノム配列情報は、診断や治療薬の選択に使用されたり、データを蓄積することで病因の解明などに有効に利用されたりするはずです。

菅野：遺伝情報の取り扱いに関する倫理問題などは、実際にやりながら整理していくのでしょうね。

日本の現状は？

–– 次世代シーケンサーは身近な装置になってきたのですね。

小川&菅野：いえいえ。確かに、世界的には、次世代シーケンサーの活用が活発化しています。しかし残念ながら、研究費の配分などを見ても、日本ではこうした動きが遅いです。

–– 例えば日本で、普通の研究者が次世代シーケンサーを使って研究したいと思ったら、どうしたらいいでしょうか。

菅野：日本での配列解析の拠点となっているのは、私の所属する東大、それに国立遺伝学研究所、理化学研究所、東北大学の4カ所です。諸外国に比べて規模は大きくありませんが、共同研究や解析の支援などを行っています。配列解読をするには、シーケンサーで配列を読んだ後、情報解析の専門家の手を借りてコンピューター解析する必要がありますが、そうした設備や専門家も備わっています。

それから、予算が許すならば、企業に外注することもできます。

小川さんの研究室でも、次世代シーケンサーを使用されていますね。

小川： 2台リースしています。現在主流のHiSeq（イルミナ社）です。小型のMiSeq（イルミナ社）を所有する研究室も多いようですが、私たちはヒトの全ゲノムを扱える容量を備えたHiSeqを使っています。MiSeqも導入したいのですが、予算の問題もあり……。

菅野：小川さんの研究室は極めて優秀で、自分たちでしっかり情報解析できるけど、一般の研究室ではなかなかそうはいかないことでしょう。現在のゲノム解析拠点をもっと充実させて、多くの研究者が利用できるようになればいいのでしょうね。シーケンサー代、コンピューター代、試薬代、電気代、人件費、維持費などは高額になりますが、国は拠点の充実を図るべきでしょう。

シーケンサーを何十台も備えた巨大なセンターが、米国、欧州、韓国、中国、などに整備され、最近では中東にも建設されつつあります。しかし日本には、そうした規模の施設がありません。

小川：ぜひ充実させるべきでしょう。

菅野：企業外注といえば、海外の企業の中には、韓国のマクロジェンのように安い受託費用をうたって取引先を増やすことに力を入れている所もあります。

小川教授の研究戦略

–– 小川教授は、次世代シーケンサーを用いた研究を次から次へと発表していらっしゃいますね。

小川：最初の論文は、2011年にNatureに出すことができました³。骨髄異形成症候群という白血病の原因遺伝子の発見です。その後も、白血病や腎がんなどの原因遺伝子を見つけてきましたが、方法的には同じです。まず、比較的少ない人数（数十人くらい）の患者さんのがんゲノムを丁寧に調べて、変異遺伝子に目星をつけます。私が調べたのはエクソンです。次に、大規模（数百人）の患者さんで確認するというやり方です。

情報解析に関しては、ヒトゲノム解析センターの宮野悟先生にご協力いただき、数理統計の研究員の方を1年間派遣していただきました。そして、情報解析のパイプライン（プログラム）を研究目的ごとに構築しました。方法論は共通ですから、ひとたび確立すれば、効率よく解析できるのです。さらに、こうした大規模な解析には高性能のコンピューターが必須で、私はヒトゲノム解析センターのスパコンを、使用料を払った上で使わせていただいています。

スパコンの整備には大変な労力とお金が必要ですから、宮野先生のご尽力には敬服するばかりです。

進化し続ける次世代シーケンサー

–– 一口に次世代シーケンサーといっても、さらに新しいタイプが登場しましたね。

菅野：一分子シーケンサーと呼ばれるPacBio（Pacific Biosciences社/日本代理店はトミー社）ですね。すでに日本では10か所以上の施設に導入されています。DNAサンプルをPCR増殖の必要がなく、1分子ずつ解読するという装置です。この機器には1万塩基連続で読める「ロングリード」といわれる大きな特徴もあります。

小川：長い塩基配列でも分断せずに読めるため、ロングリードは魅力的です。がんで重要なAlu配列は、同じ配列が反復して長くなったものなので、ショートリードでは解読できないのです。

今主流のHiSeqやMiSeqはショートリードで、100〜200塩基程度。一般的には、100塩基で使うことが多いですね。ロングリードのシーケンサーは「第三世代」と呼ばれるだけのことがあり、数千〜数万塩基が連続的に解読できるのです。

菅野：でも、PacBioは現時点ではまだエラー率が10〜15%程度ありますから、単独でのヒトへの使用は厳しいものがあります。3〜4年はまだ、ショートリードのシーケンサーで配列決定し、それをロングリードのデータで補足するといった使い方になるでしょう。米国の臨床現場でも、まだショートリードが中心です。ロングリードに変わるのは数年後、いいものが出てきてからのことでしょう。

–– 次世代シーケンサーの性能は、いろいろな側面から判断されるのですね。

菅野：処理スピード、ランニングコスト、リード長などが重要なファクターです。例えば臨床現場でのDNA診断では、MiSeqのように、処理スピードの速いものが適しているわけです。

次世代シーケンサーでは原理上、ある一定の割合で配列決定時にエラーが生じますが、エラー率は処理スピードやランニングコストに影響してきます。エラー率が高いと、同じ精度を得るためには、カバレッジ（あるいは深度）を上げる必要があります。例えば、エラー率10%の場合、カバレッジ20くらいで、全域の精度が99.9％程度になります（図2）。必要な精度には幅があるので、何回繰り返すかは目的に応じて使用者が判断します。いずれにしても、回数が増えればコストも時間も増えます。

© 2014 Illumina, Inc. All rights reserved.

ちなみに、1細胞単位でゲノム配列の違いを調べたいときには、DNAは1細胞中に2コピーしかありませんから、DNAから転写されたRNAを読んで元のDNAの配列を知るのがよい場合が多い、と思っています。RNAは多数のコピーが存在するので、何回も読むことが可能です。

個人のゲノム配列の違いを知り、その上で治療に臨むことが重要だと思います。小川誠司

小川：ヒトのゲノム配列は1人1人異なり、それがヒトの多様性の基盤となっています。ゲノム情報が全てを決めるわけではありませんが、病気を知るには、まず個人のゲノム配列の違いを知り、その上で治療に臨むことが重要だと思います。

日本でも次世代シーケンサーの活用に、今こそ本腰を入れるときだと感じています。菅野純夫

菅野：今、小川さんがおっしゃったことは、世界の医学研究の基本となる考え方です。将来DNA診断が医療現場で活用されるだろうと、ずっと言われ続けてきましたが、10〜15年かかっていよいよそのときが近づいてきています。日本でも次世代シーケンサーの活用に、今こそ本腰を入れるときだと感じています。

–– ありがとうございました。

聞き手は藤川良子（サイエンスライター）。

Author Profile

菅野純夫（すがの・すみお）

東京大学大学院新領域創成科学研究科メディカルゲノム教授。1978年東京医科歯科大学医学部卒、1982年東京大学大学院医学系研究科修了。東京大学医科学研究所ヒトゲノム解析センター助教授などを経て、2004年より現職。研究テーマは、ゲノム解析と方法論の開発。2014年より、CREST「統合1細胞解析のための革新的技術基盤」の研究統括。

小川誠司（おがわ・せいし）

京都大学大学院医学研究科腫瘍生物学教授。1988年東京大学医学部卒、1993年東京大学大学院医学系研究科博士課程修了。東京大学医学部附属病院助手、同大大学院医学系研究科特任准教授などを経て、2013年より現職。研究テーマは、分子遺伝学および分子生物学による疾患の理解と克服。

Nature ダイジェスト Vol. 11 No. 7

DOI: 10.1038/ndigest.2014.140714

参考文献

Ley, T. J., et al. Nature 456, 66-72 (2008).
Newman, A. M., et al. Nat Med. 20, 548-554(2014).
Yoshida, K., et al. Nature 478, 64-69 (2011).