Japanese Author

誰もが“バイオインフォマティシャン”の時代

中村 保一、坊農 秀雅、粕川 雄也、仲里 猛留

Nature ダイジェスト Vol. 12 No. 1 | doi : 10.1038/ndigest.2015.150122

インターネット上の情報やツールを使った遺伝子検索や配列解析など、生命科学分野では研究者や医療従事者によるビッグデータの活用が重要になってきた。そのときに役立つのが、バイオインフォマティクス(生物情報学)の基礎知識。だが日本では教育が遅れ気味だ。バイオインフォマティクス分野の草分け的存在の4人に、バイオインフォマティシャンの仕事や役割、この分野の展望を語ってもらった。

NGSを使ったゲノム解析研究におけるバイオインフォマティシャンの仕事
データ解析をする
ゲノムDNA試料をNGS(次世代シーケンサー)で読むと、データが出力される。これを解析する(❷と❸)。 [アッセンブリ/マッピング]❷現在主流のNGSでは、DNAを短い断片に切ってから読むため、データを元のDNAの順番にそろえることが必要(新規のゲノム解読の場合はアッセンブリ。参照ゲノム配列が公開済みのときはマッピング)。作業はある程度自動化(パイプライン化)も可能。 [アノテーション]❸順序が分かったデータの意味を解釈する。定法はなく、データベースを利用して同種や近縁種と比較したり、遺伝子機能を調べたりし、トライ&エラーで答えを導き出す。
解析ツール(ソフトウェア)を作る
アルゴリズム(計算方法)作りと、プログラミング(実装)の仕事がある。解析ツールは公開されていることが多い。
データベースを作る
データベースを構築し、データを格納する。検索エンジンなどを作る仕事もある。データの品質管理作業はキュレーションという。

Thinkstock

–– データサイエンスという言葉をよく耳にします。

仲里: ビッグデータが注目されているからでしょうが、それについては、生命科学分野がはるかに先行してきたと思います。大量のデータを処理解析する技術は、2000年前後のゲノムプロジェクトの頃から、バイオインフォマティクスとして発達してきたのですから。

全文を読むには購読する必要があります。既に購読されている方は下記よりログインしてください。

Nature ダイジェスト Online edition: ISSN 2424-0702 Print edition: ISSN 2189-7778

プライバシーマーク制度