2 報道機関での大規模言語モデルの利活用 ● 開発:要約・分類・校正などでの業務支援 ● 研究:性能劣化・再学習・公平性など ● Shotaro Ishihara, Hiromu Takahashi, and Hono Shirai (2022). Semantic Shift Stability: Efficient Way to Detect Performance Degradation of Word Embeddings and Pre-trained Language Models. In Proceedings of AACL-IJCNLP 2022. [paper] [github] [poster, slide] ● https://hack.nikkei.com/publications/
4 ● The 2nd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 12th International Joint Conference on Natural Language Processing ● アジアでの ACL 系会議 (北米の NAACL、欧州の EACL に対応) ● AACL としては 2020 年以来 2 度目 AACL-IJCNLP 2022 [aacl2022.org] [proceedings]
● Best Paper Award: Dead or Murdered? Predicting Responsibility Perception in Femicide News Reports [paper] [code] ● Best Theme Paper Award: What's Different between Visual Question Answering for Machine "Understanding” Versus for Accessibility? [paper] ● Best Paper Runner-up: Not another Negation Benchmark: The NaN-NLI Test Suite for Sub-clausal Negation [paper] 11 Best paper awards https://www.aacl2022.org/Blog/Best-paper-awards
18 ● Best Theme Paper (Theme Track: “Fairness in Natural Language Processing”) ● 視覚的質問応答を題材に「理解」データセットで の大きな改善が、必ずしも「アクセシビリティ」 データセットでの改善につながらないと指摘 ● 丁寧な分析・考察から、今後の方向性を提案 What's Different between Visual Question Answering for Machine "Understanding” Versus for Accessibility?
● 言語モデルで否定文がうまく扱えない問題を調査 するためデータセットを構築し広範な実験を実施 ● 特に、数量詞を含む否定文が難易度が高いことを 見い出し、今後の探求が必要だと主張 19 Not another Negation Benchmark: The NaN-NLI Test Suite for Sub-clausal Negation
20 ● 「フェイクニュース」に関するチュートリアル [proposal] ● 現実社会での実例、技術的な対策、認知的・社会 的・感情的要因、訂正後の知識修正に対する心理 的障壁など、幅広い話題を解説 ● KDD 2022 での同名企画 [url] The Battlefront of Combating Misinformation and Coping with Media Bias
25 採択論文:独自モデルをいつ再学習? Shotaro Ishihara, Hiromu Takahashi, and Hono Shirai (2022). Semantic Shift Stability: Efficient Way to Detect Performance Degradation of Word Embeddings and Pre-trained Language Models. In Proceedings of AACL-IJCNLP 2022. [paper] [code] [poster, slide]
29 ● 入力:2 つの word2vec モデル ● 出力:共通する語彙の 意味変化の度合いの平均 意味変化の度合い Semantic Shift Stability Corpus 2019 Corpus 2020 Word embeddings Anchor words Mapping: Rotate in two directions