Japanese Author

誰もが“バイオインフォマティシャン”の時代

中村 保一、坊農 秀雅、粕川 雄也、仲里 猛留

Nature ダイジェスト Vol. 12 No. 1 | doi : 10.1038/ndigest.2015.150122

インターネット上の情報やツールを使った遺伝子検索や配列解析など、生命科学分野では研究者や医療従事者によるビッグデータの活用が重要になってきた。そのときに役立つのが、バイオインフォマティクス(生物情報学)の基礎知識。だが日本では教育が遅れ気味だ。バイオインフォマティクス分野の草分け的存在の4人に、バイオインフォマティシャンの仕事や役割、この分野の展望を語ってもらった。

NGSを使ったゲノム解析研究におけるバイオインフォマティシャンの仕事
データ解析をする
ゲノムDNA試料をNGS(次世代シーケンサー)で読むと、データが出力される。これを解析する(❷と❸)。 [アッセンブリ/マッピング]❷現在主流のNGSでは、DNAを短い断片に切ってから読むため、データを元のDNAの順番にそろえることが必要(新規のゲノム解読の場合はアッセンブリ。参照ゲノム配列が公開済みのときはマッピング)。作業はある程度自動化(パイプライン化)も可能。 [アノテーション]❸順序が分かったデータの意味を解釈する。定法はなく、データベースを利用して同種や近縁種と比較したり、遺伝子機能を調べたりし、トライ&エラーで答えを導き出す。
解析ツール(ソフトウェア)を作る
アルゴリズム(計算方法)作りと、プログラミング(実装)の仕事がある。解析ツールは公開されていることが多い。
データベースを作る
データベースを構築し、データを格納する。検索エンジンなどを作る仕事もある。データの品質管理作業はキュレーションという。

Thinkstock

–– Nature ダイジェスト:データサイエンスという言葉をよく耳にします。

仲里:ビッグデータが注目されているからでしょうが、それについては、生命科学分野がはるかに先行してきたと思います。大量のデータを処理解析する技術は、2000年前後のゲノムプロジェクトの頃から、バイオインフォマティクスとして発達してきたのですから。

–– バイオインフォマティクスは、データサイエンスの先駆者なのですね。

坊農:そうですね。コンピューターやインターネットを利用して大量のデータを処理し、問題を解決するという点では両者は同じです。データの解析だけでなく、データの保管・品質管理なども含まれています。

バイオインフォマティクスは最初、大量にシーケンス(塩基配列解読)されるゲノム配列データを解析するための実践的な手法として発達しました。その後、遺伝子の機能やタンパク質の構造解析、システム生物学のシミュレーション、画像解析、医療、創薬などの分野でも使われて発展し、現在に至っています。

全文を読むには購読する必要があります。既に購読されている方は下記よりログインしてください。

Nature ダイジェスト Online edition: ISSN 2424-0702 Print edition: ISSN 2189-7778

プライバシーマーク制度