Lock in $30 Savings on PRO—Offer Ends Soon! ⏳

Using Synchronic Definitions and Semantic Relat...

hajime kiyama
October 02, 2024
10

Using Synchronic Definitions and Semantic Relations to Classify Semantic Change Types

paper introduction for japanese.

hajime kiyama

October 02, 2024
Tweet

More Decks by hajime kiyama

Transcript

  1. 発表者:⽊⼭朔 東京都⽴⼤学 修⼠2年 6TJOH4ZODISPOJD%FGJOJUJPOTBOE 4FNBOUJD3FMBUJPOTUP$MBTTJGZ 4FNBOUJD$IBOHF5ZQFT Pierluigi Cassotti, Stefano De

    Pascale, Nina Tahmasebi ACL 2024 main ※スライド中の図表は指定がない限りは上記の論⽂からの引⽤になります。
  2. "CTUSBDU n 意味変化の種類の分類タスクを提案 n 語義の定義⽂を⽤いた共時的な語義の関係を⽤いる n 単語の語義の定義⽂が意味変化の種類の予測に有益 n 意味変化の種類は意味変化検出のタスクに有益 n

    従来の意味変化検出⼿法に意味変化の種類の情報を加味 n 段階的な Word-in-Context タスクの性能を向上 n 意味が変化したかのバイナリ分類タスクの性能を向上 1
  3. -FYJDBM4FNBOUJD$IBOHF%FUFDUJPO 3 n SemEval 2020 task 1 [Schlechtweg+,2020] n 意味変化の評価データセット

    n 英語、ドイツ語、スウェーデン語、ラテン語 n ⼈⼿で usage ペアの関連性スコアを計算 n 単語の usage グラフをクラスタリングし、その語義の割合で評価 DWUG: A large Resource of Diachronic Word Usage Graphs in Four Languages より引⽤ [Schlechtweg+,2020] SemEval-2020 Task 1: Unsupervised Lexical Semantic Change Detection
  4. -4$$5%#FODINBSL n Blank の意味変化リストから作成 n 認知⾔語学的観点から 650 の意味変化の事例を分類 n ロマンス語が中⼼で英語やドイツ語に拡張

    n 歴史⾔語学者がデジタルに書き起こした 4 [Blank, 1997] Prinzipien des lexikalischen Bedeutungswandels am Beispiel der romanischen Sprachen
  5. 4FNBOUJD$IBOHFUZQF n Blank の分類の中で分類できそうな type を抽出 n Generalization(⼀般化) n 意味が⼀般的に使われるように変化

    n Specialization(特殊化) n 意味が限定的に使われるように変化 n Co-hyponymous transfer(共-下位語転移) n ある対象が同じ階層で似ている別の対象として変化 n Auto-antonymy(⾃動反意語) n 従来とは逆の意味に変化 5
  6. (FOFSBUJOHFYBNQMFTGSPN8PSE/FU n WordNet を⽤いて、語義の定義⽂のペアを⽤意 n Generalization and Specialization(⼀般化と特殊化) n 上位語と下位語の組

    n Co-hyponymous(共-下位語) n 同じ親を持つ異なる2つの⼦の組 n Antonymy(反義語) n 反対の概念を表す組 n Homonymy(同⾳異義語) n 同じ品詞かつ上記以外のランダムな組 6 同⾳異義語 下位語 上位語 共-下位語 反義語
  7. 4FUUJOH n Dataset n Train/dev/test = 80%/10%/10% n 分類クラスが均衡になるようにクラスの数を調整 n

    Model n ⽣成は Flan-T5 XL FT [Giulianelli+, 2023] を使⽤ n 分類モデルには RoBERTa large を使⽤ n Method n 2つの定義⽂δ1,δ2を1つの⽂字列として連結 n 連結した⽂を⽤いて分類器を学習 7
  8. &WBMVBUJPOPO8PSE/FU n 概ね分類は可能 n 83%~95% の正答率 n 上位語と下位語は混同 n 上位語

    in 下位語 のため n 共-下位語転移は性能が下がる n 同じ階層内の切り分けが困難? 8 同⾳異義語 下位語 上位語 共-下位語 反義語 同⾳異義語 下位語 上位語 共-下位語 反義語
  9. &WBMVBUJPOPOUIF-4$$5%#FODINBSL n 分類性能に差がある n 特殊化 n ⾼い精度で検出できている n ⼀般化と⾃動反義語 n

    中程度で検出できている n 共-下位語転移 n 検出不能 n 同じ階層のという曖昧さが困難? n データセットにはない現象? 9 同⾳異義語 下位語 上位語 共-下位語 反義語 特殊化 ⼀般化 共-下位語転移 ⾃動反義語
  10. 4FNBOUJD3FMBUFEOFTTBOE)PNPOZNZ n 実験設定 n SemEval の英語データ n 語義同⼠の定義⽂を⽣成 n 定義⽂から語義の関係を予測

    n 語義関係と⼈間の関係性スコア n 同⾳異義語は無関係のクラス1が多い n 意味変化したものはクラス4が集まる 10 同⾳異義語 下位語 上位語 共-下位語 反義語
  11. (SBEFE8PSEJO$POUFYU5BTL n 段階的 Word-in Context で評価 n ⼈⼿評価との順位相関を計算 n 関連性スコアの算出

    n 語義関係で計算⽅法を変える n 同⾳異義語の場合は無関係なので0 n それ以外のクラスは関係するので計算 11 (同⾳異義語は0にする) (同⾳異義語以外は計算する)
  12. $PODMVTJPO n 意味変化の種類の分類タスクを提案 n 語義の定義⽂を⽤いた共時的な語義の関係を⽤いる n 単語の語義の定義⽂が意味変化の種類の予測に有益 n 意味変化の種類は意味変化検出のタスクに有益 n

    従来の意味変化検出⼿法に意味変化の種類の情報を加味 n 段階的な Word-in-Context タスクの性能を向上 n 意味が変化したかのバイナリ分類タスクの性能を向上 14
  13. -JNJUBUJPO n Blank のデータセットは信⽤しても良いのか? n ⼀⼈の学者が⽤意した意味変化の分類 n ⾔語のバイアスや、バランスが取れていない可能性 n 分布仮説では不⼗分?

    n 意味変化の種類はテキストで閉じた変化ではない n ⼊⼒や⽂脈だけで分類を実施するには不⼗分 n 意味変化の種類の定義 n 分類ができそうな変化を取り出してしまっている n しっかりアノテーションする必要があり、時間とお⾦が必要… 15
  14. ײ૝ n 意味変化の種類の分類タスクを作る話は良い n WordNet をうまく使うことでできそうなところに取り組んでいる n ⼀⽅で意味変化の種類については少ない気もする n あとは、教師データが必要になるので難しい…

    n Blank の意味変化の種類のアノテーションの質がわからない n 意味変化検出に種類の情報はそこまで役に⽴ってない n 同⾳異義語を⽤意して関連のないものを0に前処理している n もっと意味変化の種類の情報を使って関連性スコアを変えるべき? n SemEval が種類の情報が⼊らないタスクになっている… n 意味変化の種類を評価するデータセットが欲しい 16
  15. ײ૝ n 定義⽂⽣成の拡張 n Fran-T5 を使って定義⽂を作っているけど GPT 系列はどうか? n 単語ベクトルから⽂ベクトルへと拡張できる

    n ⼀⽅で良い定義⽂を評価することが難しい… n ⼆つの時期から複数の時期へ n 意味変化の種類は2つの時期だけ⾒てもわからないような n 複数時期で意味変化の種類までアノテーションされると嬉しい(厳しい) 17