【RSJ2025】PAMIQ Core: リアルタイム継続学習のための⾮同期推論・学習フレームワーク

by Geson Anko

Slide 1

Slide 1 text

リアルタイム継続学習のための⾮同期推論・学習フレームワーク ML集会, GOP Co., Ltd. 撮影OK

Slide 2

Slide 2 text

1 はじめに • ⼀般の深層学習⼤規模なオフライン学習 → 静的なパイプライン実⾏ • 強化学習推論（環境インタラクション）と学習を交互実⾏ → 推論停⽌時間が発⽣動的に学習したい。しかし、推論停⽌する間も時間は進む！学習と推論の同時実⾏の必要性 • “PAMIQ Core” を実装リアルタイムに継続学習する機械知能を簡単に作れるように • PAMIQにおいて、これらの課題を解決したシステムを実装汎⽤的な枠組みの発⾒ → 再利⽤可能にする価値

Slide 3

Slide 3 text

2 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 • 既存フレームワークとの統合 PyTorch, Gymansium (OpenAI Gym) • 継続学習の運⽤⽀援機能インタラクティブ制御コンソール、状態保存など • 段階的なサンプル最⼩実装から実⽤サンプル、VRChatへの実装まで • “pip install pamiq-core” で即利⽤可能 Python Package Index (PyPI)へ公開済

Slide 4

Slide 4 text

3 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 • 既存フレームワークとの統合 PyTorch, Gymansium (OpenAI Gym) • 継続学習の運⽤⽀援機能インタラクティブ制御コンソール、状態保存など • 段階的なサンプル最⼩実装から実⽤サンプル、VRChatへの実装まで • “pip install pamiq-core” で即利⽤可能 Python Package Index (PyPI)へ公開済起動推論スレッド学習スレッド制御スレッド

Slide 5

Slide 5 text

4 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 • 既存フレームワークとの統合 PyTorch, Gymansium (OpenAI Gym) • 継続学習の運⽤⽀援機能インタラクティブ制御コンソール、状態保存など • 段階的なサンプル最⼩実装から実⽤サンプル、VRChatへの実装まで • “pip install pamiq-core” で即利⽤可能 Python Package Index (PyPI)へ公開済

Slide 6

Slide 6 text

5 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 • 既存フレームワークとの統合 PyTorch, Gymansium (OpenAI Gym) • 継続学習の運⽤⽀援機能インタラクティブ制御コンソール、状態保存など • 段階的なサンプル最⼩実装から実⽤サンプル、VRChatへの実装まで • “pip install pamiq-core” で即利⽤可能 Python Package Index (PyPI)へ公開済 Gymnasium

Slide 7

Slide 7 text

6 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 • 既存フレームワークとの統合 PyTorch, Gymansium (OpenAI Gym) • 継続学習の運⽤⽀援機能インタラクティブ制御コンソール、状態保存など • 段階的なサンプル最⼩実装から実⽤サンプル、VRChatへの実装まで • “pip install pamiq-core” で即利⽤可能 Python Package Index (PyPI)へ公開済

Slide 8

Slide 8 text

7 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 • 既存フレームワークとの統合 PyTorch, Gymansium (OpenAI Gym) • 継続学習の運⽤⽀援機能インタラクティブ制御コンソール、状態保存など • 段階的なサンプル最⼩実装から実⽤サンプル、VRChatへの実装まで • “pip install pamiq-core” で即利⽤可能 Python Package Index (PyPI)へ公開済

Slide 9

Slide 9 text

8 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 • 既存フレームワークとの統合 PyTorch, Gymansium (OpenAI Gym) • 継続学習の運⽤⽀援機能インタラクティブ制御コンソール、状態保存など • 段階的なサンプル最⼩実装から実⽤サンプル、VRChatへの実装まで • “pip install pamiq-core” で即利⽤可能 Python Package Index (PyPI)へ公開済

Slide 10

Slide 10 text

9 PAMIQ Coreの特徴 • マルチスレッドアーキテクチャシンプル・軽量な3スレッド（制御・推論・学習）実装 • モジュラー設計コンポーネントを基底クラスを元に実装。 • 既存フレームワークとの統合 PyTorch, Gymansium (OpenAI Gym) • 継続学習の運⽤⽀援機能インタラクティブ制御コンソール、状態保存など • 段階的なサンプル最⼩実装から実⽤サンプル、VRChatへの実装まで • “pip install pamiq-core” で即利⽤可能 Python Package Index (PyPI)へ公開済詳細は論⽂要旨ドキュメンテーションサイトへ https://mlshukai.github.io/pamiq-core/

Slide 11

Slide 11 text

11 システムの外観フラグ・命令フラグ・命令起動推論スレッド学習スレッド制御スレッド • ⼀時停⽌ • 再開 • 終了 • 状態保存 • 世界とインタラクション • 学習データを収集観測取得⾏動⽣成データ収集 • モデルパラメータを更新実⾏条件チェック学習を実⾏パラメータ同期移動モデルパラメータ学習データ同期コマンドフラグユーザー定義領域

Slide 12

Slide 12 text

12 各コンポーネントについて

Slide 13

Slide 13 text

14 各コンポーネントについて • Interaction, Agent, Environment 強化学習的な観測・⾏動ループの実装推論スレッド⽤ • Agent: 意思決定（ユーザー定義） • 観測から⾏動を⽣成 • 学習データを収集 • Environment: 観測・⾏動処理（ユーザー定義） • 観測を返す（実環境から取得） • ⾏動を作⽤（実環境で実⾏） • Interaction: 観測・⾏動ループの実現 • AgentとEnvironmentを繋げる Interaction Environment 観測⾏動 Agent Gymnasiumの環境を Environmentとして利⽤可能!

Slide 14

Slide 14 text

16 各コンポーネントについて • TrainingModel, InferenceModel 機械学習モデル定義 • TrainingModel（⚠ モデルの主体） • 学習スレッド上の処理フローを記述 • InferenceModelの⽣成 • パラメータの同期処理 • InferenceModel • 推論スレッド上の処理フローを記述 ⚠ 同期排他制御の実装要求 • 推論時 • パラメータ同期時 Training Model Inference Model ⽣成パラメータ同期パラメータ更新推論排他制御

Slide 15

Slide 15 text

17 各コンポーネントについて • TrainingModel, InferenceModel 機械学習モデル定義 • TrainingModel（⚠ モデルの主体） • 学習スレッド上の処理フローを記述 • InferenceModelの⽣成 • パラメータの同期処理 • InferenceModel • 推論スレッド上の処理フローを記述 ⚠ 同期排他制御の実装要求 • 推論時 • パラメータ同期時 Training Model Inference Model ⽣成パラメータ同期パラメータ更新推論 PyTorchモデルを簡単に導⼊可能! 排他制御

Slide 16

Slide 16 text

22 各コンポーネントについて • DataBuffer, DataCollector, DataUser 学習データの貯蔵と収集、利⽤ • DataBuffer ：ユーザー定義（蓄積、取得） • DataCollector ：推論スレッドインターフェイス • DataUser ：学習スレッドインターフェイス DataCollector DataUser Queue DataBuffer update add ⼀時的に蓄積（推論スレッド内）同期時にバッファへadd （学習スレッド内） get_data collect 排他制御（スレッドセーフ化）

Slide 17

Slide 17 text

24 各コンポーネントについて • Trainer 学習処理や実⾏可能条件の記述学習スレッド⽤ • 学習データの取得とパラメータ更新、同期 • 実⾏可能条件の実装（ユーザー定義可能） • デフォルトの条件 • ⼗分なデータの蓄積 • ⼗分な新規データ数 → 安定した継続学習のため処理順序 PyTorch統合では便利な基底クラスを実装済! 実⾏条件チェック学習を実⾏パラメータ同期

Slide 18

Slide 18 text

25 各コンポーネントについて • launch, LaunchConﬁg 全てをまとめ、システムを起動する。 • launch関数処理の起点 • ユーザー定義のInteraction(Agent, Environment), Model, Buﬀer, Trainerを与える

Slide 19

Slide 19 text

26 各コンポーネントについて • launch, LaunchConfig 全てをまとめ、システムを起動する。 • launch関数処理の起点 • ユーザー定義のInteraction(Agent, Environment), Model, Buffer, Trainerを与える • システムの状態保存設定 • リスタートする状態パス • 時間スケール • などなど設定可能 LaunchConfig

Slide 20

Slide 20 text

27 同期システムについて

Slide 21

Slide 21 text

28 同期システム • 設計哲学絶対に推論処理を⽌めないリアルタイム処理の実現

Slide 22

Slide 22 text

32 同期システム • PyTorchモデル学習スレッドで更新したパラメータを推論スレッドに同期する • 純粋なパラメータコピーは !(size) の計算時間 → 同期時間増加、⼤規模モデルを採⽤しにくい • ソリューション → 参照スワップ（擬似同期処理）推論スレッドから学習スレッドにコピー • Pros: 参照移動のみのため !(() の計算時間 • Cons: RNNの隠れ状態などをAgentクラス内で管理する必要性 → スワップ時に⼊れ替わる問題交換旧モデル新モデル新モデル旧モデルパラメータコピー推論スレッド学習スレッド

Slide 23

Slide 23 text

33 同期システム • 学習データ推論スレッドで収集したデータを学習スレッドへ受け渡す参照移動で同期時間を最⼩化同期処理 1. キューを新規⽣成 2. 既存キューと置換 3. キューオブジェクトごと移動 • Cons: キューのサイズを事前に設定する必要性（オーバーフロー対策）キュー推論スレッド学習スレッドバッファ

Slide 24

Slide 24 text

34 同期システム • 学習データ推論スレッドで収集したデータを学習スレッドへ受け渡す参照移動で同期時間を最⼩化同期処理 1. キューを新規⽣成 2. 既存キューと置換 3. キューオブジェクトごと移動 • Cons: キューのサイズを事前に設定する必要性（オーバーフロー対策）推論スレッド学習スレッドバッファ移動キュー新規作成・置換

Slide 25

Slide 25 text

35 同期システム • 学習データ推論スレッドで収集したデータを学習スレッドへ受け渡す参照移動で同期時間を最⼩化同期処理 1. キューを新規⽣成 2. 既存キューと置換 3. キューオブジェクトごと移動 • Cons: キューのサイズを事前に設定する必要性（オーバーフロー対策）推論スレッド学習スレッドバッファ移動キュー新規作成・置換 +

Slide 26

Slide 26 text

36 同期システム • 学習データ推論スレッドで収集したデータを学習スレッドへ受け渡す参照移動で同期時間を最⼩化同期処理 1. キューを新規⽣成 2. 既存キューと置換 3. キューオブジェクトごと移動 • Cons: キューのサイズを事前に設定する必要性（オーバーフロー対策）推論スレッド学習スレッドバッファ移動キュー新規作成・置換 +

Slide 27

Slide 27 text

37 サンプル実装について • 段階的な3つのサンプル（リンクは要旨に記載） • “minimum.py” 最⼩限の起動処理のみ記述。フレームワークのスタート地点 • “vae-torch” Variational AutoEncoder の継続学習例を実装 PyTorch統合の実践的なサンプル • “pamiq-vrchat” 仮想世界 VRChat への実装サンプルより複雑的な応⽤例

Slide 28

Slide 28 text

No content

Slide 29

Slide 29 text

39 より深くPAMIQ Coreを知りたい⼈のために • 9/6（⼟） 21:00 より、YouTube配信！ VTuberのアイシア・ソリッドさんと！ • より深い、開発のアレコレや⾃律機械知能PAMIQについてもお話しします。公式チャンネル

Slide 30

Slide 30 text

40 より深くPAMIQ Coreを知りたい⼈のために • 質問・ご感想は⼤歓迎！ • なんでスレッドベース？ • 他のフレームワークとの統合は？ • 類似アプローチってないの？ • 今後の展望は…？ • そもそもPAMIQとは…？ • 発表後、ぜひお話ししましょ〜! PAMIQ Core 公式リポジトリ