Slide 5
Slide 5 text
4
Copyright NTT CORPORATION
様々なタイプのデータを活用した上で、モーダル間やタスク間で共有可能な
知識を効率的に保持できるような統合的なモデリング・学習の実現
学習時に目指していること (この一部が本日の主眼)
自己教師あり学習 マルチタスク学習
クロスモーダル表現学習
テキスト理解部
音声音響情報
共通処理部
画像映像情報
共通処理部
感情理解部
属性理解部
Happy, Sad,
neutral
Male,
Female
Elder,
Adult, Child
“It is sunny today”
クロスモーダル
理解部
自然言語情報
共通処理部
…
とはどんなもの??(本日の主題) (主に同一入力に対して)複数タスクを
同時に学習することで、相乗効果を得た
り、タスク間の知識転移を行う
ラベルなしデータを活用して、
様々なタスクに有益な表現空間を獲得
テキスト:BERT, etc.、音声: HuBERT, etc.,
画像: Masked MAE, etc.