科学論文の図表を読み解き、有効に利活用するAIワークフローDIVEを開発
科学論文の図表を読み解き、有効に利活用するAIワークフローDIVEを開発
―水素貯蔵材料等の研究を加速―
発表のポイント
- 水素貯蔵材料の研究論文にある図表から実験データを読み取り、構造化するマルチエージェントAI(注1)ワークフローDIVE (Descriptive Interpretation of Visual Expression) を開発しました。
- 4,000報超の文献から30,000件超のデータを抽出、整備し、AIエージェント基盤DigHyd (Digital Hydrogen Platform)
として構築、公開しました。 - 整備したデータを活用して、短時間で水素貯蔵のための新しい候補材料の提案が可能になることを実証しました。
概要
近年、データ駆動型人工知能(AI)は、新しい材料探索を効率よく行うことができる技術として注目されています。しかし、材料研究の重要な実験データは、論文中の図に画像化された状態で存在することが多く、有効に利用することが難しい状況でした。
東北大学材料科学高等研究所(WPI-AIMR)の李昊(Hao Li)教授、折茂慎一 所長(同大学金属材料研究所 教授)、東京大学大学院工学系研究科の佐藤龍平助教らの研究チームは、科学論文中の図表から実験データを体系的に読み取り、科学的に解釈した上で構造化できるマルチエージェントAIワークフローDIVEを開発しました。さらに、水素貯蔵材料(注2)を対象に、DIVEを用いて4,000報以上の文献から30,000件を超えるデータを抽出し、コンピューター処理可能なデータベースとして整備することで、約2分という短時間で水素貯蔵のための新しい候補材料を提案することができる逆設計(注3)ワークフローを確立しました。これにより図表に閉じ込められていた科学データを有効に利活用することで、AI駆動型の材料探索が加速することが期待できます。本研究成果は、2026年2月3日(現地時間)に学術誌Chemical Science誌に掲載されました。
詳細な説明
研究の背景
近年、データ駆動型人工知能(AI)は、新しい材料探索を効率よく行うことができる技術として注目されています。しかし、材料研究の重要な実験データは、論文中の図に画像化された状態で存在することが多く、有効に利用することが難しい状況でした。また、現行のマルチモーダル大規模言語モデル(注4)は、科学論文中の図表から正確にデータを抽出することが難しく、得られるデータの品質や網羅性、信頼性に課題があることから、材料特性の解析や予測にも制約が生じていました。特に、将来のクリーンエネルギー技術に不可欠な水素貯蔵材料の分野では、データが断片的に存在していることが、体系的な理解や効率的な材料探索を妨げる要因の一つとなっていました。
今回の取り組み
本研究チームは、科学論文の図表を単に読み取るだけではなく、読み取ったデータを科学的根拠に基づいて解釈することを目指し、マルチエージェントAIワークフローDIVEを開発しました(図1)。DIVEでは、図表の内容理解、キャプションの解釈、数値の整合性確認といった役割を分担した複数のAIエージェントが連携し、段階的にデータ抽出と検証を行います。これにより、マルチモーダルモデルが一度に抽出する従来手法と比べて、精度だけでなく適用できる範囲も大幅に向上しました。水素貯蔵材料分野のベンチマークにおいて、DIVEは一般的なマルチモーダルモデルを10~15%上回る抽出精度を記録し、オープンソースモデルに対しては30%以上の性能向上を達成しました。さらに、4,000報の文献から30,000件を超えるデータを整理し、分析可能なAIエージェント基盤DigHydを構築しました。このデータベースを基盤として候補材料を提案する逆設計ワークフローを構築し、約2分という短時間で水素貯蔵のための新しい候補材料を提案できる例を示しました(図2)。
今後の展開
DIVEは水素貯蔵材料だけでなく、電池、触媒、熱電材料など、さまざまな材料分野でのデータベース構築と探索の効率化に応用可能です。今後は、より多様な図表形式への対応に加え、抽出データを活用した自律的な材料設計フローの高度化を図ります。AIが図表を含めて科学文献を読み解くことで材料探索を加速する、新しい研究基盤の構築を目指します。

図1. DIVEのマルチエージェントワークフロー(右上)と従来手法(左上)の比較、および水素貯蔵材料データベースにおける収集文献の分布(下)

図2. AIエージェント基盤DigHydによる新材料設計ワークフロー(文献データベースの活用から候補材料の提案・検証まで)
(a) 材料設計要件の入力 (b) 文献駆動型の候補組成生成 (c) 機械学習モデルによる水素重量密度の予測 (d) 目標指向型の反復設計と最終材料提案
謝辞
本研究は、国立研究開発法人科学技術振興機構(JST)「革新的GX技術創出事業(GteX)」水素領域(JPMJGX23H1)の支援を受けて実施しました(寄与率:GteX 100%)。
用語解説
- 注1. マルチエージェントAI
- 複数のAIが役割分担し、協調してタスクを進める仕組み。
- 注2. 水素貯蔵材料
- 金属材料などの内部に高密度かつ安全に水素を取り込み(吸蔵する)、必要に応じてはき出す(放出する)材料。
- 注3. 逆設計(インバースデザイン)
- 目的の性能を満たす材料組成や構造を、データから逆算して探索する方法。
- 注4. マルチモーダル大規模言語モデル
- テキスト情報に加え、画像、音声、動画など、異なる種類(モダリティ)のデータを統合的に理解・処理できる高度なAIモデル。
論文情報
| タイトル: | “DIVE” into Hydrogen Storage Materials Discovery with AI Agents |
|---|---|
| 著者: | Di Zhang, Xue Jia, Tran Ba Hung, Seong Hoon Jang, Linda Zhang, Ryuhei Sato, Yusuke Hashimoto, Toyoto Sato, Kiyoe Konno, Shin-ichi Orimo, Hao Li |
| 掲載誌: | Chemical Science |
| DOI: | 10.1039/d5sc09921h![]() |
問い合わせ先
研究に関すること
東北大学材料科学高等研究所
所長 折茂 慎一(研究者プロフィール)
| Tel: | 022-215-2093 |
|---|---|
| E-mail: | shin-ichi.orimo.a6@tohoku.ac.jp |
東北大学材料科学高等研究所(WPI-AIMR)
教授 李 昊(Hao Li)(研究者プロフィール)
| E-mail: | li.hao.b8@tohoku.ac.jp |
|---|
報道に関すること
東北大学材料科学高等研究所(WPI-AIMR) 広報戦略室
| Tel: | 022-217-6146 |
|---|---|
| E-mail: | aimr-outreach@grp.tohoku.ac.jp |
東京大学大学院工学系研究科 広報室
| Tel: | 03-5841-0235 |
|---|---|
| E-mail: | kouhou@pr.t.u-tokyo.ac.jp |
科学技術振興機構 広報課
| Tel: | 03-5214-8404 |
|---|---|
| E-mail: | jstkoho@jst.go.jp |
JST事業に関すること
科学技術振興機構 未来創造研究開発推進部 GteX推進グループ
波羅 仁
| Tel: | 03-3512-3543 |
|---|---|
| E-mail: | gtex@jst.go.jp |


