Upgrade to Pro — share decks privately, control downloads, hide ads and more …

DeepRacer cup本戦 ~30秒の切り方~

Avatar for chiaoi chiaoi
December 23, 2025
19

DeepRacer cup本戦 ~30秒の切り方~

Avatar for chiaoi

chiaoi

December 23, 2025
Tweet

Transcript

  1. 方針①:完走できるモデルから改良する 最初から速さを重視する → コースアウトが頻発する → 完走報酬を得る機会が少ない → 「完走」がいい行動として学習されない 完走することを重視する →

    最初の学習で「完走」がいい行動として学べる → そこから改良していけば、「完走」をしながら  徐々 に速く改良できる Curriculum learning (Bengio et al., ICML 2009)