Article

細菌およびウイルスの全登録ゲノムデータの超高速検索

Nature Biotechnology 37, 2 doi: 10.1038/s41587-018-0010-1

世界のアーカイブに保存されている細菌およびウイルスの未処理ゲノム配列データは急激に増加している。配列の検索語に関してこれらのデータの照会を行うことができれば、基礎研究にも、リアルタイムのゲノム疫学研究や調査のような応用にも役立つと考えられる。しかし、現在の方法でそれを行うことはできない。この問題を解決するため、我々は、微生物集団ゲノミクスに関する情報をウェブ検索のために考案された電算法と組み合わせることにより、BIGSI(BItsliced Genomic Signature Index)という検索可能なデータ構造を案出した。全世界から集められた細菌およびウイルス44万7833種の全ゲノム配列データセットを、既存の方法より4桁少ない容量で索引付けした。BIGSIの検索機能を利用することにより、アーカイブデータセットから耐性遺伝子MCR-1MCR-2およびMCR-3が迅速に発見され、プラスミド2827個の宿主域が明らかにされ、抗生物質耐性が定量された。この索引は新しい(未処理またはアセンブリー済みの)配列データセットが登録されるにつれて着実に拡大し、データセット数は数百万個にもなり得る。

目次へ戻る

プライバシーマーク制度