画像エンコーダ: ViT-B/32, ResNet等 ▪ テキストエンコーダ: トランスフォーマ等 ▪ 推論: 新規の画像(or テキスト)を入力して特徴量に変換 ▪ 多数の応用(DALL·E 2 [Aditya+ 2022]等) a photo of a beer bottle satellite imagery of roundabout a photo of a marimba a meme テキスト エンコーダ 画像 エンコーダ
RAL25] ③ 参照表現理解 [Nishimura+ IROS24] ④ タスク成否判定 [Goko+ CoRL24] place a red can on the front right pick up the tissue box next to the sink 「ものを置ける」「通 路ではない」等の言語 で3Dモデルから決定 x4 x16 最大3万枚の画像 を検索可能 →操作者が場所を 記憶しなくて良い
通事故発生日時等を報告しなければならない。 ▪ https://laws.e-gov.go.jp/law/335AC0000000105 ▪ 【英国】Automated and Electric Vehicles Act 2018 PART1-2 ▪ “Where an accident is caused by an automated vehicle … insurer is liable…” ※未保険やソフトウェアアップデートを怠った過失等も記載有 ▪ https://www.legislation.gov.uk/ukpga/2018/18/contents