Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ロボット模倣学習勉強会

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

 ロボット模倣学習勉強会

模倣学習の社内勉強会資料

Avatar for Minoru Natsutani

Minoru Natsutani

July 12, 2024
Tweet

More Decks by Minoru Natsutani

Other Decks in Technology

Transcript

  1. 4 強化学習と模倣学習 模倣学習(Imitation Learning)とは AI以外の意味 子供が大人の真似をして学ぶこと シミュレータを使ったパイロットの育成などでも使われる。 AI 教師あり学習 強化学習

    LLM以降 模倣学習 エキスパートの動作を正解データとして学習する。 →普通にやるとデータが全然足りない。 強化学習と組み合わせて使うやり方。 →今日はここの話をします。 LLMの場合、強化学習とは違う枠組みでエキスパートの 動作を真似できそう。要調査。 チーティングは、特定の作業に対して強 くなる手順とパラメータを取得する技術。 強化学習とは別。どちらかというとノーコ ード開発に近い。 汎化能力の向上を目指してない。
  2. 14 強化学習の出力(差分or座標) ロボ制御の場合、出力は2種類 (x, y, z, roll, pitch, yaw)の 変化量を推論する

    RT-1、RT-2、RT-X (x, y, z, roll, pitch, yaw)の 移動先を推論する こっちの方が学習しやすい。 ただし、実機の場所とAIが認識してい る場所がどんどんずれていく。 ハンドを後少し回転さ せて、5cm右に移動 (0.32, 025, 1.02)に移動して、 法線(0.22, 1.33, -0.2)にハン ドの向きを合わせて