Slide 1

Slide 1 text

1 Matlantisのこれまでと 
 これから
 岡野原 大輔 Preferred Computational Chemistry 代表取締役社長 Preferred Networks 代表取締役 最高研究責任者 Matlantis User Conference 2022/12/02

Slide 2

Slide 2 text

1

Slide 3

Slide 3 text

Preferred Computational Chemistryのバリュー 2 Share the Joy 成功に寄り添い、喜びを分かち合おう Respect One, Respect All 互いに尊重し、互いに成長しよう Be a Pioneer 終わりなき探求を楽しもう お客様の成功が、私たちの成功です。 お客様の成功に伴う喜びを分かち合うために、価値創造に対して一切の妥協を許しません。 私たちはお客様に寄り添い、信頼し合えるパートナーとして共に前進します。 私たちは、世界最先端の技術をコアとし、前例のないことに挑戦し続けます。 私たちの活動の原動力となるのは、好奇心や楽しむ心です。 常に失敗を恐れず、新しい価値を提供します。 私たちはメンバーがお互いに尊重し、自律的に行動する組織です。 一人ひとりが誠実さを持ち、お互いを理解し、助け合うことを基本姿勢としています。 私たちは個人そしてチームとして成長し続けます。

Slide 4

Slide 4 text

材料科学をどのように変えていきたいのか 3 ● 計算化学を、発見された実験結果の結果解釈のみならず有望な材料探索や 反応経路探索に使っていく。 ● 将来的には計算化学に長けた人だけでなく実験化学者なども使っていける ようにしていく。

Slide 5

Slide 5 text

Matlantisのこれまで 4

Slide 6

Slide 6 text

提供インターフェース 5 ● Matlantis開発中に提供インターフェースをどうするか議論があった。 ● 研究活動に典型的なフローは少ないためJupyter Notebookでの プログラミング環境を提供することに。 ○ 様々な手法や新しくでてきた手法を組み合わせる必要がある ○ データサイエンティスト向けのライブラリ/ツールも使える ○ 代表的な作業フローはサンプルやMatlantis Featuresでサポート ● 一方、将来的にはプログラミングをしなくても使えるようなツールも サポートしていきたい。 ○ 例 相図作成、反応経路探索等

Slide 7

Slide 7 text

学習データ 6 ● これまで延べ約1000年分のGPUリソースを利用して学習データを作成 ○ PFNの国内最大級スパコンを活用し約2年間で生成 ● 顧客からのフィードバックも利用し対応現象も拡大 ○ コミュニティレベルでのアクティブ・ラーニング PFP Number of data GPU days v0.0.0 3 x 106 6 x 104 v1.0.0 10 x 106 10 x 104 v2.0.0 17 x 106 15 x 104 v3.0.0 22 x 106 42 x 104 * * 収束しなかった等の理由で学習に使用していないデータの計算時間を含む累計 PFNの計算機クラスター (MN2)

Slide 8

Slide 8 text

PFPでは汎用性を最重要項目と位置づけ、 汎用性を維持したままの精度向上を目指してきた。 ● PFP v0 (2021/01) ● PFP v1  (2021/07/01) ○ サービスリリース ● PFP v1.1 (2021/11/16) ○ DFT-D3補正をサポート ● PFP v2 (2022/02/10) ○ フォノンの再現性向上 ○ 原子同士が近接した際の安定性の向上 ○ Hubbard補正の無い結晶系の計算モードをサポート ● PFP v.3 (2022/08/30) ○ 対応原子数を72に拡張 ○ 分子間相互作用の再現性を向上、液体の密度/粘度の推定精度改善 PFP(コアエンジン)の精度向上 7 反応 拡散 吸着 フォノン 分子間力 破綻しないMD 構造間の自由エネルギー 要求される エネルギーの精度 エネルギーのスケールと現象の模式図

Slide 9

Slide 9 text

サポート元素数を継続的に増加 8 リリース時 (2021/7) 55 現在 (2022/11) 72

Slide 10

Slide 10 text

ウェブサービス機能追加 9 ● 毎週アップデート 新機能追加、機能改善、修正 ○ UI改善 ○ ユーザー管理機能 ○ カーネル管理機能 ○ グループ内データ共有機能追加 ○ インターフェース高速化 ○ ログ(実行結果ログ、不具合時ログ) ○ 安定性改善 ○ データExport機能 ○ ドキュメント(ガイドブック、チュートリアル等) ○ スループット向上(バッチ機能追加、GPUの効率的利用) ○ バックグラウンド実行

Slide 11

Slide 11 text

Matlantis Features / サンプルコード / チュートリアル の整備 10 Examples Structural Optimization Elasticity NEB Infrared Phonon Diffusivity Viscosity Specific Heat Thermal Conductivity Gas formation Enthalpy 等

Slide 12

Slide 12 text

11 扱える系の拡大 PFVM技術 New 12 ● これまでより大きな系のシミュレーションを可能とする技術 ● PFNの最先端コンパイラ/最適化技術を利用し推論時のメモリ使用量を大きく改善 ● 2022/11/11よりβ版で提供開始 ○ ユーザーは同じプランでこれまでより大きな系が扱えるようになります ● 推論可能な系の原子数はこれまでの約1.6倍近く増加 ○ Pt bulkでこれまでの1.65倍 6千原子/16万近傍 → 1万原子/27万近傍 ○ Si bulkでこれまでの1.62倍 7千原子/17万近傍 → 1.1万原子/27万近傍 *注: 契約プランによって推論可能な系のサイズは異なります x y z 1 2 3 4 5 6 7 x y z x x x 7 6 5 4 3 2 1 1 1 1 2 2 3

Slide 13

Slide 13 text

12 PFVMを使った例 13 PFVMを使ってナノチューブ同士をぶつける例 原子数4880 実行時間は35分(下)と76分(左) 今回の例を”通常の"DFT計算で実施すると、 36コアCPUで数百年以上かかります これはPFVMがどれだけ大きな原子数を扱えるかというデモです。 (破壊を含んでおり陽に結合を表す場合では難しい例) 量子化学計算としての精度検証についてはMATLANTISサイトに ある電池や半導体プロセスの例を参考にしてください。

Slide 14

Slide 14 text

Matlantisのこれから 13

Slide 15

Slide 15 text

シミュレーションは現実世界の一部分を切り出している ● 問題をどのように切り出すか、大胆に近似するのか、 結果を解釈するのかに多くのノウハウ、アートが含まれている。 ● Matlantisは今後シミュレーション技術、計算性能を向上させていく ことで不必要なアートを少なくし、より広い範囲の問題を扱えること を目指す。 c.f., コンピュータグラフィックスにおいても 物理ベースシミュレーションが進化するにつれて、 以前必要だった特殊化や工夫が不要に。 14

Slide 16

Slide 16 text

人による創意・工夫との融合が必要 ● 一方、シミュレーションが進化しても人間による創意と工夫が必要。 「Simplicity & Balance」(真鍋淑郎 ノーベル物理学賞受賞者) 扱う現象を単純にしつつ重要な部分を抜き出すことが重要となる。 ● 原子スケールはおおまかに10-10m (~10-30 m3)、10-15sの世界。 計算機で1010程度は加速できるが、現実世界との間にまだ巨大なギャッ プ。 ● 原子のスケールでは巨視的だが人間スケールでは日常的な現象を扱うに はアートが必要。  例:レアイベントを扱えるような反応経路解析技術    材料組み合わせの効率的な探索 15

Slide 17

Slide 17 text

扱える系のスケールを大きくしていく 現在扱える原子数は現在数千〜1万、これをPFVMと計算クラスタ強化で数倍 にする。さらに数年内に扱える原子数として数万〜数百万を目指す。 → それを可能にする技術例(それぞれ取り組み中 / 検討中 / 未着手)   分散並列推論機能(研究レベルでは既に実現、製品提供は検討中)   高速に近似できるモデルへの転移学習   高速な専用HW利用   粗視化   QM/MM 系全体の中で高精度なシミュレーションが必要な部分を自動/ユーザー指示で 特定し、高精度で高コストなシミュレーションと低精度で低コストな シミュレーションを組み合わせる。 16

Slide 18

Slide 18 text

より小さいスケールの現象を扱えるようにする PFPは電子状態を考慮した上でのポテンシャルエネルギーを推定しているが、 電子状態は現在、直接推定していない。 今後電子状態やそれに由来する物性を推定できるようにしていくことも検討する。 既に研究レベルではハミルトニアン/電子状態の推定ができるような技術は確立 されつつある。製品レベルで提供できるか、どのようなインターフェースで提供 するかを検討中。 電子状態推定例:図転載 [K.T. Schütt et al., Nature Com. 2019] 17

Slide 19

Slide 19 text

プログラミング以外のインターフェースを提供 より多くのユーザーに使ってもらうため、プログラミング以外で次のような インターフェース提供も検討していく。 ● 相図作成 ● 予想される物性を提供 ● 実験で次に行うべき候補の提示 Material Projectの例 18

Slide 20

Slide 20 text

深層学習技術の活用 現在は深層学習をエネルギーや力の推定のみに利用している。 PFPの中間状態などを提供し、様々なMIタスクの特徴ベクトルとして利用。 画像やテキストでは大量のデータで事前学習して得られた特徴ベクトルを 使ってFine Tuningすることで高い汎化性能、学習効率が得られる。 材料でも同様にPFPの中間状態がMIタスクの新しい強力なフィンガープリント として利用できる可能性がある。 反応経路の効率的な探索 安定構造探索 実験結果との融合  実験結果(例:SEM画像、数値)とシミュレーション結果の統合 19

Slide 21

Slide 21 text

計算資源の強化 ● ユーザーがより多くの計算資源を効率的に使えるようにしていく ○ 例:PFVMを使い同じGPUリソースでメモリ使用量を大きく削減し、数倍大きな系を使える ● PFNが開発するAIアクセラレーター(MN-Core)の活用 ○ MN-Coreを使ったスーパーコンピュータはGreen500で世界1位に三度なっている ○ MN-Coreを使って原子レベルシミュレーションを既存GPUより5倍近く高速化できることを確認 ● 今後は新しく開発中のチップやスーパーコンピュータなどを活用し、 ユーザーに対し計算資源においても圧倒的な価値を出せるようにしていく 20

Slide 22

Slide 22 text

AIの世界で起きてきた変化 ● 画像/テキスト/動画  画像認識/ (2012~) → 画像生成 (2014〜) → テキスト条件付画像生成 (2022)                      Foundation Modelに多目的化  人によるプロンプトチューニングが急速に発展している   (人によるチューニングとAIモデルの融合) ● 同じことは計算化学でも起きうる  エネルギー/物性推定(現在)→ 材料候補生成/反応経路生成(現在も部分的に)  → 人による事前知識を踏まえた詳細な条件付による材料候補や反応経路の生成、最適化 21

Slide 23

Slide 23 text

今後もPFCC、Matlantisは進化し続けていきます。 ぜひ皆様と一緒に持続可能な社会の実現に向けて取り組んでいければと思います まとめ