Upgrade to Pro — share decks privately, control downloads, hide ads and more …

CoRL2021論文読み会

Ryo Kabutan
December 11, 2021

 CoRL2021論文読み会

「Structured deep generative models for sampling on constraint manifolds in sequential manipulation」
論文を読んでみて分かったこと解説

Ryo Kabutan

December 11, 2021
Tweet

More Decks by Ryo Kabutan

Other Decks in Science

Transcript

  1. 株丹 亮 CoRL2021論文読み会 2021.12.11 論文を読んでみて分かったこと解説 5th Annual Conference on Robot

    Learning CoRL2021 「Structured deep generative models for sampling on constraint manifolds in sequential manipulation」
  2. 株丹 亮 Kabutan Ryo 九州工業大学 西田研究室 - 2017 産業用ロボットのためのパスプランニングアルゴリズムの研究に従事。 株式会社

    安川電機 2017 – 現在 株式会社 エイアイキューブ 出向中 個人で ROS (Robot Operating System) Japan Users Groupでたまに発表しています。 主にMoveItというロボットアーム向けライブラリの解説など。 産業用ロボットのためのプランニング技術、最適化、異常検知などの知能化技術の開発に従事。 2 上記資料のURL: https://www.slideshare.net/RyoKabutan
  3. 今日の発表内容 論文タイトル Structured deep generative models for sampling on constraint

    manifolds in sequential manipulation 論文の概要(3行で) • 所望のロボットの姿勢を効率的に発見したい(サンプリングと呼ぶ) → 組み立て作業などの過程で、 障害物と干渉しない姿勢、モノが持てる姿勢などを作りたい • しかし様々な制約条件がある中でのサンプリングは非常に難しい。 • よって深層生成モデル(GAN)と最適化手法を組み合わせて効率的に サンプリングする手法を提案。 4 逐次的なマニピュレーション 制約条件付き多様体上サンプリング 構造化された深層生成モデル
  4. はじめに サンプリングとは? ランダムでサンプリングする場合の手順(2つの関節を持ったロボットの場合) joint2 joint1 ランダムに サンプリング (𝜃1 , 𝜃2

    ) y 𝜃1 x 𝜃2 関節空間 ユークリッド空間 サンプリング結果を 投影 できたら嬉しいこと(簡単にはできないこと) 𝜃1 x 𝜃2 ユークリッド空間 6 joint2 関節空間 y 実際に少しずつ角度 を変更しながら、干 渉しているかしてい ないかをすべて調べ ると 関節空間で、干渉マップが 構築できる 2軸ロボットなら そこまで大変でないが、 6、7軸ロボットであれば 各関節角度の組合わせが 膨大になる! 実際にサンプリングした結果を ユークリッド空間で表現して CADモデル同士の干渉チェックを 行う joint1 有効な姿勢が見つかるまで ランダムサンプリングを 繰り返す
  5. 提案されている手法の概要 基本方針 ① 深層生成モデル(GAN)でなるべく制約を満たす (=完全に満たしてなくてもOK)姿勢を生成する。 ② その生成した姿勢から完全に制約を満たす姿勢まで最適化手法で収束させる 11 もう少し知りたかったところ 良いと思ったところ

    論文の感想 問題の部分解または全体解を直接予測するようにネットワークを学習するような手法は提案 されているが、あくまで予測であるため完全に制約を満たすかの保証がない。 それを本論文は②できちんと保証している。 ①の学習フェーズについて、どのようにデータを収集するのかの言及が少なかった。 シミュレーションベースでとにかくランダムでもよいので姿勢を作ってデータを作る? ②の最適化手法について具体的にどのような手法を使ったのかがなかった。
  6. 提案されている手法(詳細) 基本方針 ① パラメータ𝜏で表現された多様体ℳ𝜏 を定義。推定した分布からサンプル෤ 𝑥を生成する 12 ② サンプルされた෤ 𝑥に近い𝑥を求める(制約条件を完全に満たす𝑥)

    ①、②のイメージ 制約条件を完全に満たす姿勢の集合体 ①で多様体ℳ𝜏 の推定モデルから サンプル෤ 𝑥を生成する ②の最適化で厳密解に収束させる (まだ真の解ではない)
  7. 深層生成モデルについて Wasserstein GANを使用 • 通常のGANは生成器 (generator) が似たようなデータしか出力しなくなる「モード崩壊」と呼ばれる現象が 起きやすい。モデルパラメータが発散してしまう。勾配消失現象が起きやすい。 → GANは不安定

    • Wasserstein GANはこれらの問題を解決するアプローチをとっている。 15 実際に制約を満たした サンプリング (訓練データ) =本物 Generatorによって生成され たサンプリング(偽物データ) =偽物 本論文オリジナル部分 ො 𝑥は制約を満たす真の𝑥と 偽物のデータ෤ 𝑥の間のデータ そのデータをDiscriminatorのモデル の勾配に代入。-1をするのはなぜ? 本物か偽物か際どいデータを入れて 評価をしている。 本論文オリジナル部分 Generatorによって生成され たサンプリングが制約式を満 たしているほど小さくなる。
  8. さらなる工夫 一気に所望のサンプリング結果を求めるための分布を学習するのではなく、 各操作手順に従って分割して考える。 16 • 𝑝・・・把持対象物の最終位置(置き位置) • 𝑡・・・把持対象とエンドエフェクタの相対位置(把持位置) • 𝑞1

    ・・・ピックする姿勢 • 𝑞2 ・・・プレイスする姿勢 ピックアンドプレイスの例 把持対象の最終位置を サンプリング 最終位置が与えられたときの把持位置を サンプリング 把持位置が与えられたときの ピック姿勢をサンプリング 把持位置と最終位置が与えられたときの プレイス姿勢をサンプリング
  9. 実験結果 • 200回実験 • 1回の実験の中で、何回サンプルして有効な解が得られるかを集計。 • ただし10回超えても有効な解が得られない場合は、10回として表示 18 提案手法は 比較的少ないサンプリング数で

    有効な解を発見できている 別の問題の有効解は 対象となる問題の初期解として 有効である 基準値を与えているものの 完全ランダムなので 有効解の発見は難しい 手渡し問題 組み立て問題
  10. まとめ • 制約多様体上でサンプリングを行う新しいアプローチ。 • ロボットによる逐次的なマニピュレーション問題に取り組むためのもので ある。 • 提案のフレームワークは、深層生成サンプリングモデルと、非線形最適化 問題を組み合わせ、多様体上にサンプルを投影する。 •

    問題のスケーラビリティを向上させるために、条件付き生成モデルのシー ケンスを学習することで、上記アプローチを拡張させた。 • その結果、学習した生成モデルが、ベースライン手法を上回ることが 確認された。 19