CoRL2021論文読み会

Slide 1

Slide 1 text

株丹亮 CoRL2021論文読み会 2021.12.11 論文を読んでみて分かったこと解説 5th Annual Conference on Robot Learning CoRL2021 「Structured deep generative models for sampling on constraint manifolds in sequential manipulation」

Slide 2

Slide 2 text

株丹亮 Kabutan Ryo 九州工業大学西田研究室 - 2017 産業用ロボットのためのパスプランニングアルゴリズムの研究に従事。株式会社安川電機 2017 – 現在株式会社エイアイキューブ出向中個人で ROS (Robot Operating System) Japan Users Groupでたまに発表しています。主にMoveItというロボットアーム向けライブラリの解説など。産業用ロボットのためのプランニング技術、最適化、異常検知などの知能化技術の開発に従事。 2 上記資料のURL: https://www.slideshare.net/RyoKabutan

Slide 3

Slide 3 text

最近やっていること 3 自宅で簡易的な実験システムの構築 UnityとROS(MoveIt)を連携させる

Slide 4

Slide 4 text

今日の発表内容論文タイトル Structured deep generative models for sampling on constraint manifolds in sequential manipulation 論文の概要（3行で） • 所望のロボットの姿勢を効率的に発見したい（サンプリングと呼ぶ） → 組み立て作業などの過程で、障害物と干渉しない姿勢、モノが持てる姿勢などを作りたい • しかし様々な制約条件がある中でのサンプリングは非常に難しい。 • よって深層生成モデル（GAN）と最適化手法を組み合わせて効率的にサンプリングする手法を提案。 4 逐次的なマニピュレーション制約条件付き多様体上サンプリング構造化された深層生成モデル

Slide 5

Slide 5 text

はじめにサンプリングとは？ロボット（マニピュレータ）の分野では、所望の姿勢を何らかの方策を元に抽出すること例えば、干渉しない姿勢を作成したいランダムに各関節の角度値を決定してみる → ランダムにサンプリングするというのも一種の方策干渉しなかったサンプリング＝成功したサンプリング干渉するサンプリング＝失敗したサンプリング干渉するサンプリング＝失敗したサンプリング

Slide 6

Slide 6 text

はじめにサンプリングとは？ランダムでサンプリングする場合の手順（2つの関節を持ったロボットの場合） joint2 joint1 ランダムにサンプリング (𝜃1 , 𝜃2 ) y 𝜃1 x 𝜃2 関節空間ユークリッド空間サンプリング結果を投影できたら嬉しいこと（簡単にはできないこと） 𝜃1 x 𝜃2 ユークリッド空間 6 joint2 関節空間 y 実際に少しずつ角度を変更しながら、干渉しているかしていないかをすべて調べると関節空間で、干渉マップが構築できる 2軸ロボットならそこまで大変でないが、 6、7軸ロボットであれば各関節角度の組合わせが膨大になる！実際にサンプリングした結果をユークリッド空間で表現して CADモデル同士の干渉チェックを行う joint1 有効な姿勢が見つかるまでランダムサンプリングを繰り返す

Slide 7

Slide 7 text

はじめにサンプリングとは？ 7 • 干渉しない姿勢をランダムにサンプリングし、その姿勢を一連の点列として構成するとモーションとして作ることができる。 • RRTやPRMなどのランダムサンプリング手法が有名 • 上記手法はMoveItなどのOSSで利用可能

Slide 8

Slide 8 text

はじめにサンプリングとは？箱を斜めにしないように手先姿勢を水平に保った姿勢群を作るというのも、サンプリングを工夫することで実現可能 8

Slide 9

Slide 9 text

はじめにサンプリングとは？双腕型ロボットを使って部品を手渡しをするときの姿勢をサンプリングしたい。 • 2つの手先の位置の相対関係がしきい値以下である。 • 2つの手先の姿勢の相対関係がしきい値以下である。などの制約を作る。すると下記のように様々な姿勢をサンプリングすることができる。 9

Slide 10

Slide 10 text

論文の話（やっと）導入の話から、分かること • 所望の姿勢を無限にある姿勢から効率的にサンプリングするのは非常に難しい • 制約が色々ある状況下では、さらにサンプリングは難しくなる制約の例： 非干渉でなければならない、 手先姿勢は地面に対して水平でなければならない 2つのアームの手先姿勢が相対関係が一定でなければならないなど… 10 上記のような状況下で、効率的にサンプリングするための手法が提案されている

Slide 11

Slide 11 text

提案されている手法の概要基本方針 ① 深層生成モデル（GAN）でなるべく制約を満たす（＝完全に満たしてなくてもOK）姿勢を生成する。 ② その生成した姿勢から完全に制約を満たす姿勢まで最適化手法で収束させる 11 もう少し知りたかったところ良いと思ったところ論文の感想問題の部分解または全体解を直接予測するようにネットワークを学習するような手法は提案されているが、あくまで予測であるため完全に制約を満たすかの保証がない。それを本論文は②できちんと保証している。 ①の学習フェーズについて、どのようにデータを収集するのかの言及が少なかった。シミュレーションベースでとにかくランダムでもよいので姿勢を作ってデータを作る？ ②の最適化手法について具体的にどのような手法を使ったのかがなかった。

Slide 12

Slide 12 text

提案されている手法（詳細）基本方針 ① パラメータ𝜏で表現された多様体ℳ𝜏 を定義。推定した分布からサンプル෤ 𝑥を生成する 12 ② サンプルされた෤ 𝑥に近い𝑥を求める（制約条件を完全に満たす𝑥） ①、②のイメージ制約条件を完全に満たす姿勢の集合体 ①で多様体ℳ𝜏 の推定モデルからサンプル෤ 𝑥を生成する ②の最適化で厳密解に収束させる（まだ真の解ではない）

Slide 13

Slide 13 text

提案されている手法（詳細） ①について補足 13 制約条件を数式化したもの「はじめに」で話した障害物に干渉しないという制約条件の場合、障害物とロボットの距離が0より大きい姿勢でなければならないという立式を行う。基本的に制約関数は微分可能でなければならない。開始終了学習したモデルで所望の姿勢をサンプリング非線形最適化問題を解く手法の疑似コード

Slide 14

Slide 14 text

提案されている手法（詳細）ハンドオーバー（手渡し）問題のモード切り替えの例ロボットAがピック→ ロボットBに手渡し →ロボットBがプレイス。提案手法では、上段シーンを条件として近似サンプルを生成する深層生成モデルと制約多様体に投影する非線形最適化（下段）を組み合わせたものである。 14 条件付与生成モデルでサンプリング最適化で厳密解を導出生成モデルでサンプリング Pick姿勢作成成功 Pick姿勢作成 HandOver姿勢作成 HandOver姿勢作成成功 Place姿勢作成 ① 深層生成モデル ② 最適化 Place姿勢作成成功

Slide 15

Slide 15 text

深層生成モデルについて Wasserstein GANを使用 • 通常のGANは生成器 (generator) が似たようなデータしか出力しなくなる「モード崩壊」と呼ばれる現象が起きやすい。モデルパラメータが発散してしまう。勾配消失現象が起きやすい。 → GANは不安定 • Wasserstein GANはこれらの問題を解決するアプローチをとっている。 15 実際に制約を満たしたサンプリング (訓練データ) ＝本物 Generatorによって生成されたサンプリング(偽物データ) ＝偽物本論文オリジナル部分 ො 𝑥は制約を満たす真の𝑥と偽物のデータ෤ 𝑥の間のデータそのデータをDiscriminatorのモデルの勾配に代入。-1をするのはなぜ？本物か偽物か際どいデータを入れて評価をしている。本論文オリジナル部分 Generatorによって生成されたサンプリングが制約式を満たしているほど小さくなる。

Slide 16

Slide 16 text

さらなる工夫一気に所望のサンプリング結果を求めるための分布を学習するのではなく、各操作手順に従って分割して考える。 16 • 𝑝・・・把持対象物の最終位置（置き位置） • 𝑡・・・把持対象とエンドエフェクタの相対位置（把持位置） • 𝑞1 ・・・ピックする姿勢 • 𝑞2 ・・・プレイスする姿勢ピックアンドプレイスの例把持対象の最終位置をサンプリング最終位置が与えられたときの把持位置をサンプリング把持位置が与えられたときのピック姿勢をサンプリング把持位置と最終位置が与えられたときのプレイス姿勢をサンプリング

Slide 17

Slide 17 text

実験結果手渡し問題（p.14）と組み立て問題（下図）を使って提案手法のベンチマーク 17 2台の移動式ロボットがそれぞれ1つの物体を選び、それらを組み立てる。組付け位置は回転と位置に制約があり、物体と物体は垂直に組み付ける必要がある。T字型になるように組み立てる。提案手法以外の比較対象 • Rand・・・ランダムサンプリングで初期解を作って最適化手法で制約条件を満たす解に収束させる。 • Rand Data・・・訓練データセットからランダムにサンプルして、最適化手法で今の問題の制約条件を満たす解に収束させる。初期点は同じ系列の別問題の実現可能なサンプル。多様な情報を持つ初期値を提供するため、実際には強力なベースラインとなる。

Slide 18

Slide 18 text

実験結果 • 200回実験 • 1回の実験の中で、何回サンプルして有効な解が得られるかを集計。 • ただし10回超えても有効な解が得られない場合は、10回として表示 18 提案手法は比較的少ないサンプリング数で有効な解を発見できている別の問題の有効解は対象となる問題の初期解として有効である基準値を与えているものの完全ランダムなので有効解の発見は難しい手渡し問題組み立て問題

Slide 19

Slide 19 text

まとめ • 制約多様体上でサンプリングを行う新しいアプローチ。 • ロボットによる逐次的なマニピュレーション問題に取り組むためのものである。 • 提案のフレームワークは、深層生成サンプリングモデルと、非線形最適化問題を組み合わせ、多様体上にサンプルを投影する。 • 問題のスケーラビリティを向上させるために、条件付き生成モデルのシーケンスを学習することで、上記アプローチを拡張させた。 • その結果、学習した生成モデルが、ベースライン手法を上回ることが確認された。 19

Slide 20

Slide 20 text

ご静聴ありがとうございました。質問があれば、お気軽にどうぞ！！ 20