Research Abstract


Rare variant discovery by deep whole-genome sequencing of 1,070 Japanese individuals

2015年8月21日 Nature Communications 6 : 8018 doi: 10.1038/ncomms9018

東北メディカル・メガバンク機構は、健常な日本人1,070人の全ゲノム配列と日本人集団のゲノムレファレンス配列パネル(1KJPN)の構築について報告する。本論文では、高カバレッジ(平均32.4倍)のシーケンシングを行ない、偽陽性率を推定1.0%以下とした中、新規の一塩基バリアント(SNV)1200万を含む2120万のSNVを同定した。今回の詳細な解析によって、純化選択が起こったことを示す特徴がコード領域だけでなく調節エレメントにも見つかった。 また、340万の挿入、欠損と25,923のコピー数バリアントを含む、構造の多様性のカタログ化も行った。1KJPNは、日本人集団のゲノム全体を対象とした遺伝型のインピュテーションに効果的であった。今回のデータは、高カバレッジシーケンシングが持つ、マイナーアレル頻度が0.1%以上のSNVの99.0%をカバーする特定集団のバリアントパネルを構築するための価値と、遺伝学的関連解析における複雑なヒトの疾患病態の病因となるレアバリアントを同定する際の価値を示している。

Masao Nagasaki, Jun Yasuda, Fumiki Katsuoka, Naoki Nariai, Kaname Kojima, Yosuke Kawai, Yumi Yamaguchi-Kabata, Junji Yokozawa, Inaho Danjoh, Sakae Saito, Yukuto Sato, Takahiro Mimori, Kaoru Tsuda, Rumiko Saito, Xiaoqing Pan, Satoshi Nishikawa, Shin Ito, Yoko Kuroki, Osamu Tanabe, Nobuo Fuse, Shinichi Kuriyama, Hideyasu Kiyomoto, Atsushi Hozawa, Naoko Minegishi, James Douglas Engel, Kengo Kinoshita, Shigeo Kure, Nobuo Yaegashi, ToMMo Japanese Reference Panel Project & Masayuki Yamamoto

Corresponding Authors

長﨑 正朗
東北大学 東北メディカル・メガバンク機構 ゲノム解析部門

山本 雅之
東北大学 東北メディカル・メガバンク機構 機構長

The Tohoku Medical Megabank Organization reports the whole-genome sequences of 1,070 healthy Japanese individuals and construction of a Japanese population reference panel (1KJPN). Here we identify through this high-coverage sequencing (32.4 × on average), 21.2 million, including 12 million novel, single-nucleotide variants (SNVs) at an estimated false discovery rate of <1.0%. This detailed analysis detected signatures for purifying selection on regulatory elements as well as coding regions. We also catalogue structural variants, including 3.4 million insertions and deletions, and 25,923 genic copy-number variants. The 1KJPN was effective for imputing genotypes of the Japanese population genome wide. These data demonstrate the value of high-coverage sequencing for constructing population-specific variant panels, which covers 99.0% SNVs of minor allele frequency ≥0.1%, and its value for identifying causal rare variants of complex human disease phenotypes in genetic association studies.

