Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ロボット模倣学習勉強会

 ロボット模倣学習勉強会

模倣学習の社内勉強会資料

Minoru Natsutani

July 12, 2024
Tweet

More Decks by Minoru Natsutani

Other Decks in Technology

Transcript

  1. 4 強化学習と模倣学習 模倣学習(Imitation Learning)とは AI以外の意味 子供が大人の真似をして学ぶこと シミュレータを使ったパイロットの育成などでも使われる。 AI 教師あり学習 強化学習

    LLM以降 模倣学習 エキスパートの動作を正解データとして学習する。 →普通にやるとデータが全然足りない。 強化学習と組み合わせて使うやり方。 →今日はここの話をします。 LLMの場合、強化学習とは違う枠組みでエキスパートの 動作を真似できそう。要調査。 チーティングは、特定の作業に対して強 くなる手順とパラメータを取得する技術。 強化学習とは別。どちらかというとノーコ ード開発に近い。 汎化能力の向上を目指してない。
  2. 14 強化学習の出力(差分or座標) ロボ制御の場合、出力は2種類 (x, y, z, roll, pitch, yaw)の 変化量を推論する

    RT-1、RT-2、RT-X (x, y, z, roll, pitch, yaw)の 移動先を推論する こっちの方が学習しやすい。 ただし、実機の場所とAIが認識してい る場所がどんどんずれていく。 ハンドを後少し回転さ せて、5cm右に移動 (0.32, 025, 1.02)に移動して、 法線(0.22, 1.33, -0.2)にハン ドの向きを合わせて