Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LSTMと最新の論文紹介
Search
ogawa_19
March 25, 2021
Education
1
310
LSTMと最新の論文紹介
LSTMを改良し使用した最新の論文を紹介。
単眼のカメラだけで、移動する物体の情報を推定するフレームワークを提案した。
ogawa_19
March 25, 2021
Tweet
Share
Other Decks in Education
See All in Education
JavaScript - Lecture 6 - Web Technologies (1019888BNR)
signer
PRO
0
3.1k
GOVERNOR ADDRESS:2025年9月29日合同公式訪問例会:2720 Japan O.K. ロータリーEクラブ、2025年10月6日卓話:藤田 千克由 氏(国際ロータリー第2720地区 2025-2026年度 ガバナー・大分中央ロータリークラブ・大分トキハタクシー(株)顧問)
2720japanoke
0
740
栃木にいても「だいじ」だっぺ〜! 栃木&全国アジャイルコミュニティへの参加・運営の魅力
sasakendayo
1
120
国際卓越研究大学計画|Science Tokyo(東京科学大学)
sciencetokyo
PRO
0
44k
Google Gemini (Gem) の育成方法
mickey_kubo
2
1k
生成AIとの付き合い方 / Generative AI and us
kaityo256
PRO
13
6.8k
Web Application Frameworks - Lecture 3 - Web Technologies (1019888BNR)
signer
PRO
0
3.2k
【洋書和訳:さよならを待つふたりのために】第2章 ガン特典と実存的フリースロー
yaginumatti
0
140
HTML5 and the Open Web Platform - Lecture 3 - Web Technologies (1019888BNR)
signer
PRO
2
3.1k
CSS3 and Responsive Web Design - Lecture 5 - Web Technologies (1019888BNR)
signer
PRO
1
3k
渡辺研Slackの使い方 / Slack Local Rule
kaityo256
PRO
10
10k
多様なメンター、多様な基準
yasulab
5
19k
Featured
See All Featured
Building AI with AI
inesmontani
PRO
1
610
The #1 spot is gone: here's how to win anyway
tamaranovitovic
1
880
Abbi's Birthday
coloredviolet
0
4.2k
Paper Plane
katiecoart
PRO
0
45k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
720
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
330
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
120
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
270
The Spectacular Lies of Maps
axbom
PRO
1
420
A Tale of Four Properties
chriscoyier
162
23k
Transcript
論文紹介 LSTMなど
付録2 どんなもの? 先行研究と比べて何がすごい? 技術の手法や肝は? 議論はある? どうやって有効だと検証した? 次に読むべき論文は? Learning to Forget:
Con.nual Predic.on with LSTM ・データを忘れないため、外れ値とノイズを溜め込んでしま い、大きな状況の変化に対応できない ・LSTMはRNNの中間層のユニットをLSTMと呼ばれるメモリと 入力、出力、CECの3つのゲートを持つブロックに置き換える ことで実現した。 ・学習によって誤差が発散消失しない。 ・従来10ステップに対し、1000ステップ以上の過去を記憶 ・計算コストも時間当たり0 ・過去の再帰ネットワークアルゴリズムでは勾配消失/発散問題を LSTMで解決し、長期の時系列データを学習することがでる Long Short-Term Memory h"ps://direct.mit.edu/neco/ar3cle/9/8/1735/6109/Long-Short-Term-Memory 1997年11月15日 Sepp Hochreiter , Jürgen Schmidhuber 日付 ・勾配消失問題 →誤差を保存するセル(Constant Error Carrousel:CEC) を使用する(記憶セルを用意)。 ・重み衝突(入力重み衝突・出力重み衝突) 入力ゲート・出力ゲートを使用する
付録2 どんなもの? 先行研究と比べて何がすごい? 技術の手法や肝は? 議論はある? どうやって有効だと検証した? 次に読むべき論文は? ・構造が複雑 ・制御対象であるメモリセル自身の内部状態は制御に利用され ていない
・標準的なLSTMの一定のCECウェイト1.0を、乗算式の忘却 ゲート活性化に置き換えた。 ・標準のLSTMは非連続なケースの場合優れた性能を発揮する。 だが、連続したケースでは失敗してしまう。その点忘却ゲート を用いたLSTMは良好な結果が得られる。 ・LSTMの弱点である大きな状況の変化に対応できない問題を、忘 却ゲートを用いることで、エレンガンに解決した。 Learning to Forget: Continual Prediction with LSTMh"ps://www.researchgate.net/publica3on/12292425_Learning_to_Forget_Con3 nual_Predic3on_with_LSTM 2000年10月 Felix A. GersJ ̈urgen SchmidhuberFred Cummins 日付 ・学習は30000回で行い、テストは連続100000回成功した場合 に成功とし、10回行った。
どんなもの? 先行研究と比べて何がすごい? 技術の手法や肝は? 議論はある? どうやって有効だと検証した? 次に読むべき論文は? Long short-term memory 現在の主流であるCenterTrack-Open
(LiDAR + Camera)と比べる と、バウンディングボックスと予測バウンディングボックスの 間の不整合が多い ・Waymo Open dataset,nuScenes Tracking,KITTI MOT benchmarks といった実世界の走行シーンと,多様な仮想環境における様々 な道路状況を想定した大規模シミュレーションデータセットを 用いて,当社の3D検出・追跡パイプラインを評価した。 カメラの動きに依存せずにオブジェクトの位置を更新するため に、VeloLSTMと呼ばれるオブジェクト移動学習モジュールを 設計した。(LSTMベース) ・先行研究のCenterTrack-Vision をnuScenes 3Dトラッキング・ベ ンチマークの追跡精度において、カメラベースのベスト・サブ ミッションを500%近く上回った。。 ・移動するプラットフォーム上で撮影された一連の2D画像から、 移動する物体の情報を推定するフレームワークを提案する。 ・公開されているすべての手法の中で、ビジョンのみで提出され た最も優れた手法を500%上回った。 Monocular Quasi-Dense 3D Object Tracking h"ps://arxiv.org/abs/2103.07351 hYps://arxiv.org/abs/2103.07351 arXiv:2103.07351v1 [cs.CV] 12 Mar 2021 Hou-Ning Hu, Yung-Hsu Yang, Tobias Fischer, Trevor Darrell, Fisher Yu, and Min Sun 日付
付録 https://waymo.com/open/ https://www.nuscenes.org/tracking?externalData=all&mapData=all&modalities=Any データセット http://www.cvlibs.net/datasets/kitti/eval_mots.php