Slide 1

Slide 1 text

誰もがMN-Coreを利用できるAIクラウドサービス: Preferred Computing Platform 照屋 大地 AIコンピューティング事業本部 基盤技術部 部長 株式会社Preferred Networks

Slide 2

Slide 2 text

2 自己紹介 AIコンピューティング本部基盤技術部 部長 照屋大地 装置開発 製造・構築ロジ 工事段取り &現場 これまでの主な業務は・・・ etc.

Slide 3

Slide 3 text

3 PFNのMissionと、基盤技術部の役割 Mission: 現実世界を計算可能にし、 共に未来を作り出す AIソリューション & 製品 生成AI基盤モデル 計算基盤 AI半導体 “そのためには、息をするように 大規模な計算をできるようにしたいですよね” 基盤技術部では、AIの開発と利用に関わる様々なシーンに 対応した計算基盤とその技術を社内外の研究者様・開発者様 に提供しています。

Slide 4

Slide 4 text

4 Chip-to-Workload Architecture & ASIC Computer System & Software Computer Cluster & Orchestration Service & Research Projects AIコンピューティング本部全体で連携し、 MN-Core シリーズの計算能力を “チップから活用まで” 一貫してデリバリ 基盤技術部 社内外のユーザの みなさま MN-Core 開発部 Feedback ソフトウェア 開発部 Cooperation

Slide 5

Slide 5 text

5 MN-Core based Computer Cluster MN-3

Slide 6

Slide 6 text

6 Green500/Top500にまつわる計算基盤の取り組み 計算機システム構築 Level3 計測システム構築 計測イベント 記録システム構築 Green500連覇への道のり /情報処理学会・学会誌「情報処理」 MN-3の高精度電力計測にむけた取り組み /PFN Tech Blog MN-3が動き出します/PFN Tech Blog

Slide 7

Slide 7 text

7 計算機の利用を支える社内計算基盤システム (-2026) Kubernetes + PFN’s Custom Scheduler Interactive Environment Build-and-run CLI tools kubectl & Workflow 手軽な実験に 活用する Manifest不要で 分散学習など 自由にk8sを 使いこなす 実験・学習・サービスと AI 開発プロセス内の多様な開発を支援

Slide 8

Slide 8 text

MN-Core から MN-Core 2 へ

Slide 9

Slide 9 text

9 MN-Core 2 における設計・運用の改善活動例 ボード交換オペ改善 MN-Server 2 MN-Server MN-Server と比較して 現場オペコスト改善 性能改善のほか、運用に関する改善活動も実施しています: マネジメント系通信 アーキテクチャ/プロトコル開発 フットプリント改善・高密度化 4boards/7RU 8boards/5RU

Slide 10

Slide 10 text

PFNの MN-Core シリーズと 計算基盤の体験を皆様へ!

Slide 11

Slide 11 text

11 Preferred Computing Platform (PFCP) これまでのPFNの経験・蓄積に基づく、 MN-Core™ シリーズを唯一利用できる 深層学習・AIワークロード向けクラウドサービス pfcomputing.com PFCP User Guide

Slide 12

Slide 12 text

12 利用イメージ PFCP公式サイト 右上からも辿れます! 詳細はユーザーガイドへ! 組織別でログインをします 認証情報の取得やネームスペース 管理等 ポータルサイトを通じて 操作を行います 実際の計算は k8s で実行します

Slide 13

Slide 13 text

13 利用イメージ PFCP公式サイト 右上からもご覧いただけます!   PFCP pfcomputing.com

Slide 14

Slide 14 text

14 コア機能:Kubernetes を通した MN-Core 2 の利用 対話型実験環境 (Workspace) タスク定期実行、MPI Job による分散学習、 および大規模言語モデルの推論など 設定・構築不要で、深層学習・AIワークロード向けに拡張された Kubernetesクラスタを通して MN-Core 2 が利用可能

Slide 15

Slide 15 text

15 安全なサービス公開: ブラウザ・API からのアクセス ロボットアカウントによる トークンを用いたアクセス 人間による ブラウザからのアクセス OpenID Connect Bearer トークン 認証基盤を通した安全なアクセスによる ブラウザアクセスやサービスバックエンド機能の提供

Slide 16

Slide 16 text

16 管理機能:モニタリングと組織管理 管理コンソール ワークロード・計算資源監視 Grafana/Prometheusを試用したモニタリング・アラーティング およびポータルを通したユーザ管理等を組織ごとに独立して提供

Slide 17

Slide 17 text

17 Simple Cache Service (SCS)と、 その苦労話の一例 ここでHash アルゴリズム変更 深層学習のための分散キャッシュシ ステム - Preferred Networks Tech Blog データセット読み込み等を補助するための Simple Cache Service を提供 深層学習のための分散キャッシュシステム - Preferred Networks Tech Blog Podのライフサイクルを跨いで高速な永続ストレージへのアクセ スを実現するデータキャッシュの仕組み: SCSを提供しています。 Topology Aware Hints を利用したL3負荷分散、Consistent Hashing によるL7負荷分散などを通して、システム全体での高 速化を実現しています。 運用開始当初では負荷・オブジェクトの偏りが観測されたため、 偏りを減らすことが可能な MAGLEVを用いた分散とする等の改 善活動も実施しています。

Slide 18

Slide 18 text

18 日本語を入力・出力言語とするテキスト翻訳に特化して PFNが フルスクラッチ開発した大規模言語モデル(LLM) PLaMo™翻訳 のサービス提供*1 PFCP 利用事例: PLaMo 翻訳 *1 日本語の翻訳に特化したPLaMo翻訳のサブスクリプション サービスを正式リリース - 株式会社Preferred Networks PLaMo翻訳 : https://translate.preferredai.jp PLaMo 翻訳 システム構成概略 Google Cloud Cloud Run vLLM

Slide 19

Slide 19 text

19 Preferred Computing Platform (PFCP) これまでのPFNの経験・蓄積に基づく、 MN-Core™ シリーズを唯一利用できる 深層学習・AIワークロード向けクラウドサービス pfcomputing.com PFCP User Guide

Slide 20

Slide 20 text

Making the real world computable