フィードフォワードニューラルネットワークを用いた記号入出力制御系に対する制御器設計 / Controller Design for Augmented Systems with Symbolic Inputs and Outputs Using Feedforward Neural Network

フィードフォワードニューラルネットワークを用いた記号入出力制御系に対する制御器設計日比野弘太郎小中英嗣（名城大）

研究背景従来の制御器設計 • システムの数式モデルに基づく制御器設計 • 複雑なシステムではモデルを求めることが困難データ駆動制御 •
システムの入出力データに基づく制御器設計 [1] 金子修. データ駆動制御のこれまでの流れと最新の研究動向計測と制御

研究背景（データ駆動制御） • 入出力データの特性によって様々な場面で応用が可能 • 入力が離散値で出力が連続値である場合は、電力変換や化学プラントの制御器設計に応用可能[2] [2]小中英嗣. 機械学習に基づく離散値制御系に対する制御器設計. 電気学会論文誌C 制御対象
𝑢(𝑘) 𝑦(𝑘) 𝑢 ∈ 𝑈 = {−3, 0, 3}

研究背景（データ駆動制御） • 本研究では入出力データの特性を特殊な条件に設定 • 入出力データの互いの大小関係、順序関係が不明であると仮定する（記号化）制御対象 𝒖(𝑘) 𝒚(𝑘) 𝒖
∈ 𝑈 = 1,0,0 , 0,1,0 , 0,0,1 𝒚 = 𝑌 ∈ { 1,0,0,0 , 0,1,0,0 , 0,0,1,0 , [0,0,0,1]}

研究背景（目的） • 入出力が記号化された閉ループ制御系制御対象制御器参照出力出力入力

研究背景（目的） • 入出力が記号化された閉ループ制御系制御対象制御器参照出力入力出力

研究背景（目的） • 入出力が記号化された閉ループ制御系制御対象制御器参照出力出力入力

研究背景（目的） • 入出力が記号化された閉ループ制御系制御対象制御器参照出力出力入力目的：参照出力に対して、
適切な入力を選択する制御器を設計する

問題設定 • 本研究で使用する制御系 • 制御対象 • メモリ • 制御器制御対象
制御器メモリ𝑴𝒚 メモリ𝑴𝒖

問題設定（制御対象） • 制御対象の入出力 • 入出力データはそれぞれ 𝑵𝑼 、𝑵𝒀 通りに記号化 𝒖 ∈
𝑈 = {𝒖 , 𝒖 , ⋯ 𝒖 } 𝒚 ∈ 𝑌 = {𝒚 , 𝒚 , ⋯ 𝒚 } 制御対象メモリ𝑴𝒖 制御対象メモリ𝑴𝒚 制御器

問題設定（制御対象） • 制御対象の入出力 • 入出力データはそれぞれ 𝑵𝑼 、𝑵𝒀 通りに記号化 𝒖 ∈
𝑈 = {𝒖 , 𝒖 , ⋯ 𝒖 } 𝒚 ∈ 𝑌 = {𝒚 , 𝒚 , ⋯ 𝒚 } 制御対象入力出力メモリ𝑴𝒖 制御対象メモリ𝑴𝒚 制御器

問題設定（メモリ） • メモリ • メモリ𝑴𝒚 、𝑴𝒖 はそれぞれ 𝒏𝒂 、 𝒏𝒃
サンプル過去からの出力、入力を記憶するメモリ 𝑘 入力時系列出力時系列 𝑴 (𝑛 = 3) 𝑴 (𝑛 = 2) 𝒚(𝑘) 𝒖(𝑘) メモリ𝑴𝒖 制御対象メモリ𝑴𝒚 制御器

問題設定（制御器） • 制御器の入出力 𝒖(𝑘) 𝒀(𝑘) 𝑼(𝑘) 𝒚(𝑘) 𝒚 (𝑘) 目的：
入出力時系列を用いて、与えられた参照出力に対して、制御対象の出力を近づける入力を選択するメモリ𝑴𝒖 制御対象メモリ𝑴𝒚 制御器制御器

問題設定（制御器）制御器はニューラルネットワークで構成するメモリ𝑴𝒖 制御対象メモリ𝑴𝒚 制御器

学習方法 • 学習データ取得方法(1/2) • 乱数で生成した入力時系列を制御対象に印加して出力時系列を取得制御対象入力時系列出力時系列 𝒖(𝑘) 𝒚(𝑘)
𝑘 𝑘

学習方法 • 学習データ取得方法(1/2) • 乱数で生成した入力時系列を制御対象に印加して出力時系列を取得制御対象入力時系列出力時系列 𝒖(𝑘) 𝒚(𝑘)
𝑘 𝑘 入出力時系列を使用して学習データを作成する

学習方法 • 学習データ取得方法(2/2)

学習方法 • 学習データ取得方法(2/2) 𝑘 𝒀 𝑘 = [𝒚 𝑘 ,
𝒚 𝑘 − 1 , ⋯ 𝒚 (𝑘 − 𝑛 )] 𝑼 𝑘 = [𝒖 𝑘 − 1 , ⋯ 𝒖 (𝑘 − 𝑛 )] 𝒚 𝑘 = 𝒚 (𝑘) 𝒚 𝑘 = 𝒚 (𝑘 + 𝑛 ) 𝒗 𝑘 = 𝒖 (𝑘) 学習データ教師データ時刻kに対する学習データ・教師データ対

𝒚 𝑘 − 1 , ⋯ 𝒚 (𝑘 − 𝑛 )] 𝑼 𝑘 = [𝒖 𝑘 − 1 , ⋯ 𝒖 (𝑘 − 𝑛 )] 𝒚 𝑘 = 𝒚 (𝑘) 𝒚 𝑘 = 𝒚 (𝑘 + 𝑛 ) 𝒗 𝑘 = 𝒖 (𝑘) 学習データ教師データ 𝑛 = 3 時刻kに対する学習データ・教師データ対

𝒚 𝑘 − 1 , ⋯ 𝒚 (𝑘 − 𝑛 )] 𝑼 𝑘 = [𝒖 𝑘 − 1 , ⋯ 𝒖 (𝑘 − 𝑛 )] 𝒚 𝑘 = 𝒚 (𝑘) 𝒚 𝑘 = 𝒚 (𝑘 + 𝑛 ) 𝒗 𝑘 = 𝒖 (𝑘) 学習データ教師データ 𝑛 = 3 時刻kに対する学習データ・教師データ対 𝑛 = 3

𝒚 𝑘 − 1 , ⋯ 𝒚 (𝑘 − 𝑛 )] 𝑼 𝑘 = [𝒖 𝑘 − 1 , ⋯ 𝒖 (𝑘 − 𝑛 )] 𝒚 𝑘 = 𝒚 (𝑘) 𝒚 𝑘 = 𝒚 (𝑘 + 𝑛 ) 𝒗 𝑘 = 𝒖 (𝑘) 学習データ教師データ時刻kに対する学習データ・教師データ対 𝑛 = 3 𝑛 = 3

𝒚 𝑘 − 1 , ⋯ 𝒚 (𝑘 − 𝑛 )] 𝑼 𝑘 = [𝒖 𝑘 − 1 , ⋯ 𝒖 (𝑘 − 𝑛 )] 𝒚 𝑘 = 𝒚 (𝑘) 𝒚 𝑘 = 𝒚 (𝑘 + 𝑛 ) 𝒗 𝑘 = 𝒖 (𝑘) 学習データ教師データ 𝑛 = 2 時刻kに対する学習データ・教師データ対 𝑛 = 3 𝑛 = 3

𝒚 𝑘 − 1 , ⋯ 𝒚 (𝑘 − 𝑛 )] 𝑼 𝑘 = [𝒖 𝑘 − 1 , ⋯ 𝒖 (𝑘 − 𝑛 )] 𝒚 𝑘 = 𝒚 (𝑘) 𝒚 𝑘 = 𝒚 (𝑘 + 𝑛 ) 𝒗 𝑘 = 𝒖 (𝑘) 学習データ教師データ時刻kに対する学習データ・教師データ対 𝑛 = 3 𝑛 = 2 𝑛 = 3

学習方法 • 学習データ取得方法(2/2) 𝑘 𝒀 (𝑘) 𝑼 (𝑘) 𝒚 (𝑘)
𝒚 (𝑘) 𝒗 (𝑘)

学習方法 • 学習データ取得方法(2/2) 𝑘 𝒀 (𝑘) 𝒚 (𝑘) 𝒚 (𝑘)
𝑼 (𝑘) 𝒗 (𝑘)

数値実験の条件 • 数値実験の条件 • 制御対象 • メモリ • 学習の設定制御対象

数値実験の条件（制御対象） • 制御対象の状態方程式 𝑥 (𝑘 + 1) = 𝑥 (𝑘)
1 + 𝑥 (𝑘) + 𝑢(𝑘) 𝑥 𝑘 + 1 = 𝑥 𝑘 𝒚 𝑘 = 𝒉 𝑥 𝑘 , 𝑥 𝑘 制御対象

1 + 𝑥 (𝑘) + 𝑢(𝑘) 𝑥 𝑘 + 1 = 𝑥 𝑘 𝒚 𝑘 = 𝒉 𝑥 𝑘 , 𝑥 𝑘 [3]Narendra and Kannan Parthasarathy. Identification and Control of Dynamical Systems Using Neural Networks 制御対象 𝑥 𝑘 + 1 = 𝑥 𝑘 1 + 𝑥 𝑘 + 𝑢 (𝑘) 離散時間系のベンチマークモデル 1ステップ前の状態変数を追加

1 + 𝑥 (𝑘) + 𝑢(𝑘) 𝑥 𝑘 + 1 = 𝑥 𝑘 𝒚 𝑘 = 𝒉 𝑥 𝑘 , 𝑥 𝑘 [3]Narendra and Kannan Parthasarathy. Identification and Control of Dynamical Systems Using Neural Networks 制御対象 𝑥 𝑘 + 1 = 𝑥 𝑘 1 + 𝑥 𝑘 + 𝑢 (𝑘) 離散時間系のベンチマークモデル

数値実験の条件（制御対象） • 入力の記号化 𝑢 ∈ 𝑈 = {−0.7,0,0.7} 𝒖 ∈
𝑈 = { 1,0,0 , 0,1,0 , [0,0,1]} 制御対象ワンホットエンコーディング

数値実験の条件（制御対象） • 記号化関数制御対象 𝑥 (𝑘 + 1) = 𝑥
(𝑘) 1 + 𝑥 (𝑘) + 𝑢(𝑘) 𝑥 𝑘 + 1 = 𝑥 𝑘 𝒚 𝑘 = 𝒉 𝑥 𝑘 , 𝑥 𝑘 [𝑥 , 𝑥 ]の状態空間を分割して対応する記号を割り当てる

数値実験の条件（制御対象） 𝑥 (𝑘 + 1) = 𝑥 (𝑘) 1 +
𝑥 (𝑘) + 𝑢(𝑘) 𝑥 𝑘 + 1 = 𝑥 𝑘 𝒚 𝑘 = 𝒉 𝑥 𝑘 , 𝑥 𝑘 [𝑥 , 𝑥 ]に対して、対応するラベルを割り当てる

数値実験の条件（制御対象） 𝑥 (𝑘 + 1) = 𝑥 (𝑘) 1 +
𝑥 (𝑘) + 𝑢(𝑘) 𝑥 𝑘 + 1 = 𝑥 𝑘 𝒚 𝑘 = 𝒉 𝑥 𝑘 , 𝑥 𝑘 [𝑥 , 𝑥 ]に対して、対応するラベルを割り当てる 𝑌 = { 1,0,0.0 , 0,1,0,0 , 0,0,1,0 , [0,0,0,1]} ワンホットエンコーディング

数値実験の条件（メモリ） • メモリの⾧さ 𝑛 = 1、𝑛 = 1と設定 𝑘 𝒀(𝑘)
𝑼(𝑘)

数値実験の条件（学習の設定） • 学習の設定 • 20000サンプルの入力時系列を制御対象に印加 Plant 入力時系列出力時系列 𝒖(𝑘) 𝒚(𝑘)
𝑘 𝑘 20000サンプル 20000サンプル制御対象

数値実験の条件（学習の設定） • 学習データ（1000サンプル）乱数で生成した入力時系列 (1000サンプル)を印加

数値実験の条件（学習の設定） • 学習の設定 • 入出力時系列を使用してニューラルネットワークを学習 Plant 𝒖(𝑘) 𝒚(𝑘) 制御対象

数値実験の結果

数値実験の結果緑マーカー：参照出力赤マーカー：制御出力入力値

数値実験の結果緑マーカー：参照出力赤マーカー：制御出力入力値参照出力を100ステップごとに変更することで、異なる記号への追従と同じ記号への収束を評価

数値実験の結果緑マーカー：参照出力赤マーカー：制御出力入力値参照出力を100ステップごとに変更することで、異なる記号への追従と同じ記号への収束を評価 2つのマーカーが、重なっている部分は
参照出力と制御出力が一致している

数値実験の結果 • 0～100ステップ -0.7を入力し続けて領域1 にとどまる

数値実験の結果 • 101～200ステップ 0.7を入力し続けて領域4にとどまる

数値実験の結果 • 201～300ステップ 0を入力し続けて領域4にとどまる

数値実験の結果 • 301～400ステップ入力切替えにより、他の領域に遷移しながら領域3にとどまる

結果の考察 • 制御系に与えられた参照出力に対して、制御対象の出力を追従させることができた • ニューラルネットワークの学習によって入出力が記号化された制御系に対して適切な入力を選択する制御器を設計することができたと考えられる

まとめ • 本研究では、ニューラルネットワークによる記号入出力制御系に対する制御器設計を行った。その結果、制御対象の出力が、参照出力を追従する入力を選ぶ制御器を設計することができた。 • 今後の課題 • 記号入出力制御系の実応用例の調査 •
時系列データに適した学習モデルを使用

フィードフォワードニューラルネットワークを用いた記号入出力制御系に対する制御器設計 / Con...

フィードフォワードニューラルネットワークを用いた記号入出力制御系に対する制御器設計 / Controller Design for Augmented Systems with Symbolic Inputs and Outputs Using Feedforward Neural Network

More Decks by konakalab

Other Decks in Science

Featured

Transcript