ジャポニカアレイ:1070人の日本人参照パネルから日本人集団に適したSNPアレイを設計し遺伝子型インピューテーションの精度を向上
Japonica array: improved genotype imputation by designing a population-specific SNP array with 1070 Japanese individuals
2015年6月25日 Journal of Human Genetics 60, (2015) doi: 10.1038/jhg.2015.68

東北大学東北メディカル・メガバンク機構は、1070人の日本人の全ゲノム塩基配列データから、2000万個を超える一塩基多型(SNP)を含む参照パネル(1KJPNパネル)を構築した。この1KJPNパネルは、これまでで最も多くの日本人集団ハプロタイプを含んでいる。今回、1KJPNパネルから、新規にSNPアレイを設計し、ジャポニカアレイと名付けた。ジャポニカアレイは日本人の全ゲノムインピューテーションを行うのに適している。このアレイには、インピューテーションのためのタグSNP、Y染色体やミトコンドリアのSNP、これまでに報告されたゲノムワイド関連研究や薬理ゲノミクスに関連するSNPといった659253個のSNPが含まれている。1KJPNパネルや国際1000ゲノムプロジェクトのパネルといろいろなSNPアレイを用いて比較した結果、既存の市販SNPアレイよりもジャポニカアレイの方が日本人のインピューテーションに優れた性能を持つことが示された。一般的SNP〔マイナー対立遺伝子頻度(MAF)>5%〕については、ジャポニカアレイのゲノムカバー率(r2>0.8)は96.9%であり、つまり、ほぼすべてのコモンSNPはこのアレイでカバーされる。一方、ジャポニカアレイの低頻度SNP(0.5%<MAF≤5%)のカバー率は67.2%に達しており、これは既存のアレイのカバー率よりも高い。さらに、1KJPNの288試料を用いて、ジャポニカアレイの遺伝子型判定性能が高品質であることを確認した。平均のコール率は99.7%で、ハイスループット塩基配列解読から得られた遺伝子型との一致率は平均99.7%であった。この研究で実証されたように、集団特異的な参照パネルに基づいたSNPアレイの作製は、ゲノムワイドな遺伝子型インピューテーションを活用した関連研究を促進する実用的な方法である。
The Tohoku Medical Megabank Organization constructed the reference panel (referred to as the 1KJPN panel), which contains >20 million single nucleotide polymorphisms (SNPs), from whole-genome sequence data from 1070 Japanese individuals. The 1KJPN panel contains the largest number of haplotypes of Japanese ancestry to date. Here, from the 1KJPN panel, we designed a novel custom-made SNP array, named the Japonica array, which is suitable for whole-genome imputation of Japanese individuals. The array contains 659 253 SNPs, including tag SNPs for imputation, SNPs of Y chromosome and mitochondria, and SNPs related to previously reported genome-wide association studies and pharmacogenomics. The Japonica array provides better imputation performance for Japanese individuals than the existing commercially available SNP arrays with both the 1KJPN panel and the International 1000 genomes project panel. For common SNPs (minor allele frequency (MAF)>5%), the genomic coverage of the Japonica array (r2>0.8) was 96.9%, that is, almost all common SNPs were covered by this array. Nonetheless, the coverage of low-frequency SNPs (0.5%<MAF≤5%) of the Japonica array reached 67.2%, which is higher than those of the existing arrays. In addition, we confirmed the high quality genotyping performance of the Japonica array using the 288 samples in 1KJPN; the average call rate 99.7% and the average concordance rate 99.7% to the genotypes obtained from high-throughput sequencer. As demonstrated in this study, the creation of custom-made SNP arrays based on a population-specific reference panel is a practical way to facilitate further association studies through genome-wide genotype imputations.