マルチタスク学習 クロスモーダル表現学習 テキスト理解部 音声音響情報 共通処理部 画像映像情報 共通処理部 感情理解部 属性理解部 Happy, Sad, neutral Male, Female Elder, Adult, Child “It is sunny today” クロスモーダル 理解部 自然言語情報 共通処理部 … とはどんなもの??(本日の主題) (主に同一入力に対して)複数タスクを 同時に学習することで、相乗効果を得た り、タスク間の知識転移を行う ラベルなしデータを活用して、 様々なタスクに有益な表現空間を獲得 テキスト:BERT, etc.、音声: HuBERT, etc., 画像: Masked MAE, etc.