【RSJ2025】PAMIQ Core: リアルタイム継続学習のための⾮同期推論・学習フレームワーク

リアルタイム継続学習のための⾮同期推論・学習フレームワーク ML集会, GOP Co., Ltd. 撮影OK

1 はじめに • ⼀般の深層学習⼤規模なオフライン学習 → 静的なパイプライン実⾏ • 強化学習推論（環境インタラクション）と学習を交互実⾏
→ 推論停⽌時間が発⽣動的に学習したい。しかし、推論停⽌する間も時間は進む！学習と推論の同時実⾏の必要性 • “PAMIQ Core” を実装リアルタイムに継続学習する機械知能を簡単に作れるように • PAMIQにおいて、これらの課題を解決したシステムを実装汎⽤的な枠組みの発⾒ → 再利⽤可能にする価値

2 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 •
既存フレームワークとの統合 PyTorch, Gymansium (OpenAI Gym) • 継続学習の運⽤⽀援機能インタラクティブ制御コンソール、状態保存など • 段階的なサンプル最⼩実装から実⽤サンプル、VRChatへの実装まで • “pip install pamiq-core” で即利⽤可能 Python Package Index (PyPI)へ公開済

既存フレームワークとの統合 PyTorch, Gymansium (OpenAI Gym) • 継続学習の運⽤⽀援機能インタラクティブ制御コンソール、状態保存など • 段階的なサンプル最⼩実装から実⽤サンプル、VRChatへの実装まで • “pip install pamiq-core” で即利⽤可能 Python Package Index (PyPI)へ公開済起動推論スレッド学習スレッド制御スレッド

既存フレームワークとの統合 PyTorch, Gymansium (OpenAI Gym) • 継続学習の運⽤⽀援機能インタラクティブ制御コンソール、状態保存など • 段階的なサンプル最⼩実装から実⽤サンプル、VRChatへの実装まで • “pip install pamiq-core” で即利⽤可能 Python Package Index (PyPI)へ公開済 Gymnasium

既存フレームワークとの統合 PyTorch, Gymansium (OpenAI Gym) • 継続学習の運⽤⽀援機能インタラクティブ制御コンソール、状態保存など • 段階的なサンプル最⼩実装から実⽤サンプル、VRChatへの実装まで • “pip install pamiq-core” で即利⽤可能 Python Package Index (PyPI)へ公開済詳細は論⽂要旨ドキュメンテーションサイトへ https://mlshukai.github.io/pamiq-core/

11 システムの外観フラグ・命令フラグ・命令起動推論スレッド学習スレッド制御スレッド • ⼀時停⽌
• 再開 • 終了 • 状態保存 • 世界とインタラクション • 学習データを収集観測取得⾏動⽣成データ収集 • モデルパラメータを更新実⾏条件チェック学習を実⾏パラメータ同期移動モデルパラメータ学習データ同期コマンドフラグユーザー定義領域

12 各コンポーネントについて

14 各コンポーネントについて • Interaction, Agent, Environment 強化学習的な観測・⾏動ループの実装推論スレッド⽤ • Agent:
意思決定（ユーザー定義） • 観測から⾏動を⽣成 • 学習データを収集 • Environment: 観測・⾏動処理（ユーザー定義） • 観測を返す（実環境から取得） • ⾏動を作⽤（実環境で実⾏） • Interaction: 観測・⾏動ループの実現 • AgentとEnvironmentを繋げる Interaction Environment 観測⾏動 Agent Gymnasiumの環境を Environmentとして利⽤可能!

16 各コンポーネントについて • TrainingModel, InferenceModel 機械学習モデル定義 • TrainingModel（⚠ モデルの主体） •
学習スレッド上の処理フローを記述 • InferenceModelの⽣成 • パラメータの同期処理 • InferenceModel • 推論スレッド上の処理フローを記述 ⚠ 同期排他制御の実装要求 • 推論時 • パラメータ同期時 Training Model Inference Model ⽣成パラメータ同期パラメータ更新推論排他制御

17 各コンポーネントについて • TrainingModel, InferenceModel 機械学習モデル定義 • TrainingModel（⚠ モデルの主体） •
学習スレッド上の処理フローを記述 • InferenceModelの⽣成 • パラメータの同期処理 • InferenceModel • 推論スレッド上の処理フローを記述 ⚠ 同期排他制御の実装要求 • 推論時 • パラメータ同期時 Training Model Inference Model ⽣成パラメータ同期パラメータ更新推論 PyTorchモデルを簡単に導⼊可能! 排他制御

22 各コンポーネントについて • DataBuffer, DataCollector, DataUser 学習データの貯蔵と収集、利⽤ • DataBuffer ：ユーザー定義（蓄積、取得）
• DataCollector ：推論スレッドインターフェイス • DataUser ：学習スレッドインターフェイス DataCollector DataUser Queue DataBuffer update add ⼀時的に蓄積（推論スレッド内）同期時にバッファへadd （学習スレッド内） get_data collect 排他制御（スレッドセーフ化）

24 各コンポーネントについて • Trainer 学習処理や実⾏可能条件の記述学習スレッド⽤ • 学習データの取得とパラメータ更新、同期 • 実⾏可能条件の実装（ユーザー定義可能）
• デフォルトの条件 • ⼗分なデータの蓄積 • ⼗分な新規データ数 → 安定した継続学習のため処理順序 PyTorch統合では便利な基底クラスを実装済! 実⾏条件チェック学習を実⾏パラメータ同期

25 各コンポーネントについて • launch, LaunchConﬁg 全てをまとめ、システムを起動する。 • launch関数処理の起点 •
ユーザー定義のInteraction(Agent, Environment), Model, Buﬀer, Trainerを与える

26 各コンポーネントについて • launch, LaunchConfig 全てをまとめ、システムを起動する。 • launch関数処理の起点 •
ユーザー定義のInteraction(Agent, Environment), Model, Buffer, Trainerを与える • システムの状態保存設定 • リスタートする状態パス • 時間スケール • などなど設定可能 LaunchConfig

27 同期システムについて

28 同期システム • 設計哲学絶対に推論処理を⽌めないリアルタイム処理の実現

32 同期システム • PyTorchモデル学習スレッドで更新したパラメータを推論スレッドに同期する • 純粋なパラメータコピーは !(size) の計算時間 →
同期時間増加、⼤規模モデルを採⽤しにくい • ソリューション → 参照スワップ（擬似同期処理）推論スレッドから学習スレッドにコピー • Pros: 参照移動のみのため !(() の計算時間 • Cons: RNNの隠れ状態などをAgentクラス内で管理する必要性 → スワップ時に⼊れ替わる問題交換旧モデル新モデル新モデル旧モデルパラメータコピー推論スレッド学習スレッド

33 同期システム • 学習データ推論スレッドで収集したデータを学習スレッドへ受け渡す参照移動で同期時間を最⼩化同期処理 1. キューを新規⽣成 2.
既存キューと置換 3. キューオブジェクトごと移動 • Cons: キューのサイズを事前に設定する必要性（オーバーフロー対策）キュー推論スレッド学習スレッドバッファ

既存キューと置換 3. キューオブジェクトごと移動 • Cons: キューのサイズを事前に設定する必要性（オーバーフロー対策）推論スレッド学習スレッドバッファ移動キュー新規作成・置換

既存キューと置換 3. キューオブジェクトごと移動 • Cons: キューのサイズを事前に設定する必要性（オーバーフロー対策）推論スレッド学習スレッドバッファ移動キュー新規作成・置換 +

37 サンプル実装について • 段階的な3つのサンプル（リンクは要旨に記載） • “minimum.py” 最⼩限の起動処理のみ記述。フレームワークのスタート地点 • “vae-torch”
Variational AutoEncoder の継続学習例を実装 PyTorch統合の実践的なサンプル • “pamiq-vrchat” 仮想世界 VRChat への実装サンプルより複雑的な応⽤例

39 より深くPAMIQ Coreを知りたい⼈のために • 9/6（⼟） 21:00 より、YouTube配信！ VTuberのアイシア・ソリッドさんと！ • より深い、開発のアレコレや⾃律機械知能PAMIQについ
てもお話しします。公式チャンネル

40 より深くPAMIQ Coreを知りたい⼈のために • 質問・ご感想は⼤歓迎！ • なんでスレッドベース？ • 他のフレームワークとの統合は？ •
類似アプローチってないの？ • 今後の展望は…？ • そもそもPAMIQとは…？ • 発表後、ぜひお話ししましょ〜! PAMIQ Core 公式リポジトリ

【RSJ2025】PAMIQ Core: リアルタイム継続学習のための⾮同期推論・学習フレームワーク

【RSJ2025】PAMIQ Core: リアルタイム継続学習のための⾮同期推論・学習フレームワーク

Geson Anko

More Decks by Geson Anko

Other Decks in Science

Featured

Transcript

リアルタイム継続学習のための⾮同期推論・学習フレームワーク ML集会, GOP Co., Ltd. 撮影OK

1 はじめに • ⼀般の深層学習⼤規模なオフライン学習 → 静的なパイプライン実⾏ • 強化学習推論（環境インタラクション）と学習を交互実⾏

2 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 •

3 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 •

4 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 •

5 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 •

6 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 •

7 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 •

8 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 •

9 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 •

11 システムの外観フラグ・命令フラグ・命令起動推論スレッド学習スレッド制御スレッド • ⼀時停⽌

12 各コンポーネントについて

14 各コンポーネントについて • Interaction, Agent, Environment 強化学習的な観測・⾏動ループの実装推論スレッド⽤ • Agent:

16 各コンポーネントについて • TrainingModel, InferenceModel 機械学習モデル定義 • TrainingModel（⚠ モデルの主体） •

17 各コンポーネントについて • TrainingModel, InferenceModel 機械学習モデル定義 • TrainingModel（⚠ モデルの主体） •

22 各コンポーネントについて • DataBuﬀer, DataCollector, DataUser 学習データの貯蔵と収集、利⽤ • DataBuﬀer ：ユーザー定義（蓄積、取得）

24 各コンポーネントについて • Trainer 学習処理や実⾏可能条件の記述学習スレッド⽤ • 学習データの取得とパラメータ更新、同期 • 実⾏可能条件の実装（ユーザー定義可能）

25 各コンポーネントについて • launch, LaunchConﬁg 全てをまとめ、システムを起動する。 • launch関数処理の起点 •

26 各コンポーネントについて • launch, LaunchConﬁg 全てをまとめ、システムを起動する。 • launch関数処理の起点 •

27 同期システムについて

28 同期システム • 設計哲学絶対に推論処理を⽌めないリアルタイム処理の実現

32 同期システム • PyTorchモデル学習スレッドで更新したパラメータを推論スレッドに同期する • 純粋なパラメータコピーは !(size) の計算時間 →

33 同期システム • 学習データ推論スレッドで収集したデータを学習スレッドへ受け渡す参照移動で同期時間を最⼩化同期処理 1. キューを新規⽣成 2.

34 同期システム • 学習データ推論スレッドで収集したデータを学習スレッドへ受け渡す参照移動で同期時間を最⼩化同期処理 1. キューを新規⽣成 2.

35 同期システム • 学習データ推論スレッドで収集したデータを学習スレッドへ受け渡す参照移動で同期時間を最⼩化同期処理 1. キューを新規⽣成 2.

36 同期システム • 学習データ推論スレッドで収集したデータを学習スレッドへ受け渡す参照移動で同期時間を最⼩化同期処理 1. キューを新規⽣成 2.

37 サンプル実装について • 段階的な3つのサンプル（リンクは要旨に記載） • “minimum.py” 最⼩限の起動処理のみ記述。フレームワークのスタート地点 • “vae-torch”

39 より深くPAMIQ Coreを知りたい⼈のために • 9/6（⼟） 21:00 より、YouTube配信！ VTuberのアイシア・ソリッドさんと！ • より深い、開発のアレコレや⾃律機械知能PAMIQについ

40 より深くPAMIQ Coreを知りたい⼈のために • 質問・ご感想は⼤歓迎！ • なんでスレッドベース？ • 他のフレームワークとの統合は？ •