Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Forklift Goal Condition Reinforcement Learning ...

Sponsored · SiteGround - Reliable hosting with speed, security, and support you can count on.

Forklift Goal Condition Reinforcement Learning by Gazebo + ROS2 topic

Avatar for takeofuture

takeofuture

May 17, 2026

More Decks by takeofuture

Other Decks in Technology

Transcript

  1. 興味のある仕事 ▪ 先端技術と情報技術の融合と応用 ▪ データサイエンス ▪ AI(生成AI,分析AI,識別AI), 統計や機械学習 ▪ ロボット、AI支援型CADや部品設計製造

    柴田 たけお ▪ 愛知県名古屋市生まれ豊田市育ち ▪ 大学,大学院では地球物理専攻 ▪ 本業ロサンゼルス商社のデータサイエンティスト 個人でAI関連含むプロジェクト多数やったつもり ▪ 愛知県豊田市の空家に年数回滞在(日米2拠点生活) 基本情報 趣味 ▪ キャンプやハイキング ▪ 自転車旅行 ▪ 青春18切符でのんびり列車旅行 ▪ 食べること @takeofuture https://zenn.dev/takeofuture
  2. ▪ GAZEBOとは ▪ 強化学習とは ▪ 環境や物体を定義 ▪ コマンド(テレオペ)でマニュアル操作デモ ▪ 強化学習方針(Phase別の報酬設計と制約)

    ▪ 1地点目標の強化学習の様子 ▪ 目標条件付き強化学習: 通路1(AISLE-1)の全てのBIN(仕切り)で ▪ 目標条件付き強化学習: 全通路、全仕切りで ▪ 目標条件付き強化学習: 全通路、全棚(4つの高さ)で ▪ 動的位置へのへの強化学習へ! 目次
  3. GAZEBOとは 物理エンジンを搭載したシミュレータ • ライセンス形態 :オープンソース。Gazebo Sim関連ライブラリは主に Apache License 2.0。 •

    物理エンジン :現在のGazebo Simは標準で DART を使用。Gazebo Physicsの抽象レイヤーにより、他の物理エンジンもプラグインとして切替・追加可能。 • ROS 2連携:ros_gz_bridge により、ROS 2とGazebo間でtopic/serviceを橋渡しでき、joint state、センサー情報、制御コマンドなどを相互にやり取りできる。 • 用途:実機を使う前に、ロボットの移動・衝突・センサー・制御を仮想環境で検証できる。 👉完全仮想の世界と現実世界のギャップを埋める! 仮想世界 シミュレータ 厳しい現実
  4. 強化学習(RL)とは 強化学習の教科書でよくつかわれるグリッド世界の例 グリッドは環境 エージェントはネズミくん、グリッドのことは知らない 目隠しして進むイメージ 行動パターンは左右上下へすすむ (右と上だけでもいい) 報酬が最高になるようにゴールに進むよう 報酬やペナルティーを設計して自律的に最適な方法を 自律的学習するAIの手法の一種

    👉最初は行動をランダムに選択するが報酬をもらったりペ ナルティをくらうことで学び報酬最大化を得るようになること が知られている。学習が進むに冒険とグリーディーな最適方 法を一定確率で切り分けて局所最適化しないような工夫もさ れている。