Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Matlantisのこれまでとこれから_岡野原_Matlantis User Conference

Matlantisのこれまでとこれから_岡野原_Matlantis User Conference

2022年12月2日開催の「Matlantis User Conference」において、株式会社Preferred Computational Chemistry 代表取締役社長 岡野原大輔が「Matlantisのこれまでとこれから」という題にて講演いたしました。
https://matlantis.com/ja/

Matlantis

July 24, 2023
Tweet

More Decks by Matlantis

Other Decks in Technology

Transcript

  1. 1 Matlantisのこれまでと これから 岡野原 大輔 Preferred Computational Chemistry 代表取締役社長 Preferred

    Networks 代表取締役 最高研究責任者 Matlantis User Conference 2022/12/02
  2. 1

  3. Preferred Computational Chemistryのバリュー 2 Share the Joy 成功に寄り添い、喜びを分かち合おう Respect One,

    Respect All 互いに尊重し、互いに成長しよう Be a Pioneer 終わりなき探求を楽しもう お客様の成功が、私たちの成功です。 お客様の成功に伴う喜びを分かち合うために、価値創造に対して一切の妥協を許しません。 私たちはお客様に寄り添い、信頼し合えるパートナーとして共に前進します。 私たちは、世界最先端の技術をコアとし、前例のないことに挑戦し続けます。 私たちの活動の原動力となるのは、好奇心や楽しむ心です。 常に失敗を恐れず、新しい価値を提供します。 私たちはメンバーがお互いに尊重し、自律的に行動する組織です。 一人ひとりが誠実さを持ち、お互いを理解し、助け合うことを基本姿勢としています。 私たちは個人そしてチームとして成長し続けます。
  4. 提供インターフェース 5 • Matlantis開発中に提供インターフェースをどうするか議論があった。 • 研究活動に典型的なフローは少ないためJupyter Notebookでの プログラミング環境を提供することに。 ◦ 様々な手法や新しくでてきた手法を組み合わせる必要がある

    ◦ データサイエンティスト向けのライブラリ/ツールも使える ◦ 代表的な作業フローはサンプルやMatlantis Featuresでサポート • 一方、将来的にはプログラミングをしなくても使えるようなツールも サポートしていきたい。 ◦ 例 相図作成、反応経路探索等
  5. 学習データ 6 • これまで延べ約1000年分のGPUリソースを利用して学習データを作成 ◦ PFNの国内最大級スパコンを活用し約2年間で生成 • 顧客からのフィードバックも利用し対応現象も拡大 ◦ コミュニティレベルでのアクティブ・ラーニング

    PFP Number of data GPU days v0.0.0 3 x 106 6 x 104 v1.0.0 10 x 106 10 x 104 v2.0.0 17 x 106 15 x 104 v3.0.0 22 x 106 42 x 104 * * 収束しなかった等の理由で学習に使用していないデータの計算時間を含む累計 PFNの計算機クラスター (MN2)
  6. PFPでは汎用性を最重要項目と位置づけ、 汎用性を維持したままの精度向上を目指してきた。 • PFP v0 (2021/01) • PFP v1 (2021/07/01)

    ◦ サービスリリース • PFP v1.1 (2021/11/16) ◦ DFT-D3補正をサポート • PFP v2 (2022/02/10) ◦ フォノンの再現性向上 ◦ 原子同士が近接した際の安定性の向上 ◦ Hubbard補正の無い結晶系の計算モードをサポート • PFP v.3 (2022/08/30) ◦ 対応原子数を72に拡張 ◦ 分子間相互作用の再現性を向上、液体の密度/粘度の推定精度改善 PFP(コアエンジン)の精度向上 7 反応 拡散 吸着 フォノン 分子間力 破綻しないMD 構造間の自由エネルギー 要求される エネルギーの精度 エネルギーのスケールと現象の模式図
  7. ウェブサービス機能追加 9 • 毎週アップデート 新機能追加、機能改善、修正 ◦ UI改善 ◦ ユーザー管理機能 ◦

    カーネル管理機能 ◦ グループ内データ共有機能追加 ◦ インターフェース高速化 ◦ ログ(実行結果ログ、不具合時ログ) ◦ 安定性改善 ◦ データExport機能 ◦ ドキュメント(ガイドブック、チュートリアル等) ◦ スループット向上(バッチ機能追加、GPUの効率的利用) ◦ バックグラウンド実行
  8. Matlantis Features / サンプルコード / チュートリアル の整備 10 Examples Structural

    Optimization Elasticity NEB Infrared Phonon Diffusivity Viscosity Specific Heat Thermal Conductivity Gas formation Enthalpy 等
  9. 11 扱える系の拡大 PFVM技術 New 12 • これまでより大きな系のシミュレーションを可能とする技術 • PFNの最先端コンパイラ/最適化技術を利用し推論時のメモリ使用量を大きく改善 •

    2022/11/11よりβ版で提供開始 ◦ ユーザーは同じプランでこれまでより大きな系が扱えるようになります • 推論可能な系の原子数はこれまでの約1.6倍近く増加 ◦ Pt bulkでこれまでの1.65倍 6千原子/16万近傍 → 1万原子/27万近傍 ◦ Si bulkでこれまでの1.62倍 7千原子/17万近傍 → 1.1万原子/27万近傍 *注: 契約プランによって推論可能な系のサイズは異なります x y z 1 2 3 4 5 6 7 x y z x x x 7 6 5 4 3 2 1 1 1 1 2 2 3
  10. 人による創意・工夫との融合が必要 • 一方、シミュレーションが進化しても人間による創意と工夫が必要。 「Simplicity & Balance」(真鍋淑郎 ノーベル物理学賞受賞者) 扱う現象を単純にしつつ重要な部分を抜き出すことが重要となる。 • 原子スケールはおおまかに10-10m

    (~10-30 m3)、10-15sの世界。 計算機で1010程度は加速できるが、現実世界との間にまだ巨大なギャッ プ。 • 原子のスケールでは巨視的だが人間スケールでは日常的な現象を扱うに はアートが必要。 例:レアイベントを扱えるような反応経路解析技術 材料組み合わせの効率的な探索 15
  11. 扱える系のスケールを大きくしていく 現在扱える原子数は現在数千〜1万、これをPFVMと計算クラスタ強化で数倍 にする。さらに数年内に扱える原子数として数万〜数百万を目指す。 → それを可能にする技術例(それぞれ取り組み中 / 検討中 / 未着手) 分散並列推論機能(研究レベルでは既に実現、製品提供は検討中)

    高速に近似できるモデルへの転移学習 高速な専用HW利用 粗視化 QM/MM 系全体の中で高精度なシミュレーションが必要な部分を自動/ユーザー指示で 特定し、高精度で高コストなシミュレーションと低精度で低コストな シミュレーションを組み合わせる。 16
  12. 計算資源の強化 • ユーザーがより多くの計算資源を効率的に使えるようにしていく ◦ 例:PFVMを使い同じGPUリソースでメモリ使用量を大きく削減し、数倍大きな系を使える • PFNが開発するAIアクセラレーター(MN-Core)の活用 ◦ MN-Coreを使ったスーパーコンピュータはGreen500で世界1位に三度なっている ◦

    MN-Coreを使って原子レベルシミュレーションを既存GPUより5倍近く高速化できることを確認 • 今後は新しく開発中のチップやスーパーコンピュータなどを活用し、 ユーザーに対し計算資源においても圧倒的な価値を出せるようにしていく 20
  13. AIの世界で起きてきた変化 • 画像/テキスト/動画 画像認識/ (2012~) → 画像生成 (2014〜) → テキスト条件付画像生成

    (2022) Foundation Modelに多目的化 人によるプロンプトチューニングが急速に発展している (人によるチューニングとAIモデルの融合) • 同じことは計算化学でも起きうる エネルギー/物性推定(現在)→ 材料候補生成/反応経路生成(現在も部分的に) → 人による事前知識を踏まえた詳細な条件付による材料候補や反応経路の生成、最適化 21