Slide 20
Slide 20 text
ertex equence Detector 頂点座標列を出力するモデル
● エンコーダ
○ ision ransformer ( i ) mall など エンコーダで画像 潜在特徴を作成
● デコーダ
○ 頂点座標 シーケンス生成
■ ransformer型 デコーダで建物 頂点座標を離散的なトークン列として生成
[ start, v1_x, v1_y, v2_x, v2_y, v3_x, v3_y, v4_x, v4_y, end ]
■ 画像 座標 あらかじめ 224 個 ビンに分割され、各頂点 x, y 座標 それぞれこれら ビン番
号(整数値)として離散化
○ 特殊トークン 利用:
■ 開始トークン(start):
シーケンス 開始 合図
■ 終了トークン(end):
シーケンス 終端
■ パッドトークン:
シーケンス長を揃えるダミー
※シーケンス長 超パラ
手法: ertex equence Detector
20