Letter

遺伝学:韓国人のゲノムのde novoアセンブリとフェージング解析

Nature 538, 7624 doi: 10.1038/nature20098

ゲノムのアセンブリおよびフェージング解析の進歩により、ヒトゲノムの二倍体構造を調べる機会が得られ、これによって複数の集団にわたる構造的多様性の全容が明らかになっている。今回我々は、韓国人の1個体AK1について、単一分子リアルタイム塩基配列解読、次世代マッピング、マイクロ流体技術を用いて合成したロングリード(linked read)、および細菌人工染色体(BAC)を用いた塩基配列解読の手法を用い、ゲノムのde novoアセンブリおよびハプロタイプのフェージング解析を行った。単一分子塩基配列解読と次世代マッピングとを組み合わせることで、長く連続したアセンブリが得られ、そのN50コンティグサイズは17.9 メガ塩基(Mb)、N50骨格サイズは44.8 Mbで、8本の染色体アームはそれぞれ単一の骨格全体にわたっていた。ヒト参照ゲノムのユークロマチン領域に存在した190のギャップのうち、今回のde novoアセンブリと局所的なアセンブリ、そして長い領域にわたるロングリードによって、105のギャップが埋められた上、72のギャップも狭められ、結果としてこれまで扱いが困難であった塩基配列に1.03 Mbの配列が加わった。このアセンブリと、6万2758個のBACクローンから得られた両末端塩基配列がよく一致していることから、今回のアセンブリの信頼性が強く裏付けられる。このアセンブリとヒト参照ゲノムのデータとの直接比較から、1万8210の構造的バリアントが明らかになり、我々の知るかぎりまだ報告されていない切断点が数千見つかった。このような挿入の大部分はトランスクリプトームに反映されており、アジア人集団全体で共通している。全ゲノム塩基配列解読に由来するショートリード、ロングリード、および合成ロングリード、また、3万1719個のBACクローンに由来するショートリードを用いて、このアセンブリのハプロタイプフェージング解析を行い、N50サイズが11.6 Mbの、フェーズが決定されたハプロタイプブロックを得た。単一分子のリアルタイム塩基配列解読で構築されたハプロティグ(haplotig;同じハプロタイプを持つクローンのコンティグ)を、フェーズが決定されたブロックのハプロタイプに割り当てたところ、遺伝子の89%が対応していた。これらのハプロティグは、主要組織適合性複合体の超可変領域を正確に特徴付けており、 CYP2D6などの臨床関連遺伝子の対立遺伝子構造も示していた。我々の研究は、二倍体ヒトゲノムについてのこれまでで最も連続的なアセンブリを示すとともに、報告例のないアジア人特異的な構造的バリアントを広範に調査したものであり、さらには、精密医療のための臨床関連対立遺伝子の高品質なハプロタイプ解析の実証でもある。

目次へ戻る

プライバシーマーク制度