Article

進化遺伝学:NHLBI TOPMedプログラムからの5万3831例の多様なゲノムの塩基配列解読

Nature 590, 7845 doi: 10.1038/s41586-021-03205-y

TOPMed(Trans-Omics for Precision Medicine)プログラムは、心臓、肺、血液、睡眠の障害の遺伝的構造と生物学的性質の解明を目指し、これらの疾患の診断、治療、予防の改善を最終目標としている。このプログラムの初期段階では、豊富な表現型データと多様な背景を持つ人々の全ゲノム塩基配列解読に重点が置かれた。今回我々は、TOPMedの目標と設計に加えて、利用可能な研究情報資源と、その塩基配列データから得られた初期の手掛かりについて報告する。これらの研究情報資源には、バリアントブラウザー、遺伝型インピュテーションサーバー、dbGaP(Database of Genotypes and Phenotypes)データベースを通して利用可能なゲノムと表現型のデータが含まれる。最初の5万3831例のTOPMed試料において、参照ゲノムとのアラインメント後に、4億を超える一塩基バリアントと挿入欠失(indel)バリアントが検出された。また、マッピングされていなかったリードのアセンブリと、可変性の高い座位に特化した解析から、これまでに報告されていなかったバリアントが新たに検出された。検出された4億以上のバリアントのうち、97%は頻度が1%未満であり、46%(血縁関係のない参加者間では53%)は1人にしか存在しないシングルトンだった。これらのまれなバリアントからは、変異の過程や最近のヒト進化史に関する手掛かりが得られる。TOPMed研究の遺伝的多様性の広範なカタログは、まれな非コード塩基配列バリアントの表現型の多様性への関与を探索する上で、他に類のない機会を提供する。さらに、TOPMedのハプロタイプと最新のインピュテーション法を組み合わせると、ゲノム規模関連解析の能力と範囲が改善され、頻度約0.01%のバリアントまで含めることができる。

目次へ戻る

プライバシーマーク制度