Slide 3
Slide 3 text
Platform Technology Division Copyright 2020 Sony Semiconductor Solutions Corporation
DATE
3/xx
今回のモデルについて:Transformerをベースにした手法
②ネットワーク
・特徴量をDenseレイヤーで次元圧縮
・Transformerブロックは2段のみ。(LayerNorm
レイヤーは削除)
・最後にクラス数に合わせてDense&softmax
①特徴量生成
・お手製の特徴量を設計し、ネットワークに入力
入力データ:
・体、口、手の座標
・上記を変換した情報
座標、相対位置、角度、座標移動速度、座標移動加速度
角度速度、座標ベクトル、形情報
RAW 543
(x,y,z)
Position
Normalization
Downsampling
Max length =32
Feature
Embedding
(Dense x 2)
Transformer
Encoder x 2
(w/o LayerNorm)
Dense &
SoftMax
dim=317
1. Preprocessing 2. Network
Feature Stack &
Dense
Dim = 512
Dim = 384
x 20 feature
Feature
Generation
(x, y)