化学合成:失敗実験を用いた機械学習による材料の発見
Nature 533, 7601 doi: 10.1038/nature17439
有機鋳型法による金属酸化物、金属有機構造体(MOF)、有機ハロゲン化物ペロブスカイトなどの無機–有機ハイブリッド材料は数十年にわたって研究されており、水熱合成や(非水)ソルボサーマル合成によって、総合すると周期表上のほぼ全ての金属を含む数千種に及ぶ新材料が合成されてきた。それにもかかわらず、こうした化合物の形成は完全には解明されておらず、新化合物の開発は主として探索的合成に頼っている。シミュレーションやデータに基づく手法(マテリアル・ゲノム・イニシアチブなどの取り組みによって促進される)を用いれば、実験的な試行錯誤に代わる戦略が得られる。主要な戦略として、1)シミュレーションに基づく物理的特性(例えば、電荷移動度、光起電力特性、ガス吸着能、リチウムイオンのインターカレーション)の予測による有望な合成ターゲット候補の特定、2)ハイスループットの合成ツールと測定ツールの組み合わせによって可能になる大量の実験データからの構造–特性関係の決定、3)類似の結晶構造に基づくクラスター分析(例えば、ゼオライト構造の分類やガス吸着特性)がある。今回我々は、反応データを学習した機械学習アルゴリズムを使用して、鋳型法による亜セレン酸バナジウムの結晶化に関する反応結果を予測する代替手法を実証した。我々の研究室に保管されていた実験ノートから収集した「ダークな(日の目を見ていない)」反応(ここでは失敗した水熱合成)に関する情報を用い、ケモインフォマティクス技術を用いてこのノートの未加工情報に物理化学的特性の記述を追加した。そして、得られたデータを用いて、反応の成功を予測するように機械学習モデルを学習させた。過去に調べたことのない市販の有機構成要素を用いて水熱合成実験を行ったところ、今回の機械学習モデルは、従来の人間の戦略よりも優れており、有機鋳型法で新しい無機生成物を形成する条件を89%の成功率で予測した。この機械学習モデルを逆に利用することによって、生成物形成に成功する条件に関する新しい仮説が明らかになる。

