NLP2018 報告会

029be5ac1ce0db70c46dcd7152308e2e?s=47 masaya82
March 19, 2018
48

NLP2018 報告会

029be5ac1ce0db70c46dcd7152308e2e?s=128

masaya82

March 19, 2018
Tweet

Transcript

  1. 言語処理学会第24回年次大会 参加報告 長岡技術科学大学 自然言語処理研究室 福嶋 真也

  2. 報告内容 • 気になった研究について • 年次大会全体の感想 1

  3. 気になった研究について • 「NP1のNP2」の意味情報のアノテーション 鈴木莉子, 高山沙也加, 北川舞, 田中リベカ, 峯島宏次, 戸次大介 (お茶大)

    C3-2 • WORD GINI: 語の使用の偏りを捉える指標の提案とその応 用 村山太一, 若宮翔子, 荒牧英治 (NAIST) C4-4 • 知識工学者のためのWikipediaカテゴリ構造の再整理の構想 吉岡真治 (北大/理研AIP), 中川嵩教 (北大) P12-1 2
  4. 「NP1のNP2」の意味情報のアノテーション • 日本語の格助詞「の」は様々な意味を持つ。 例:「作家の夏目先生の最初の本」 「作家である夏目先生が最初に書いた本」 • NPCMJコーパスに出現する「NP1のNP2」の表現に対して専 門家2人と非専門家3人でアノテートを行った。 • 判定が一致しない事例がいくつか存在した。

    ・飽和と不飽和 ・飽和と全体部分 など 3
  5. WORD GINI: 語の使用の偏りを捉える指標の提案とその応用 • 語の「使用頻度」でなく、「偏り」の観点から見ることで語の標 準性を定義する試みを行った。 • 偏りを表す指標としてジニ係数を導入した。 (0から1の範囲で、大きいほど偏りが大きいことを示す。) •

    Twitterで人、時間、場所についての情報から偏り値を求め、 語の平易化及び標準性について実験を行ったところ、どちら のタスクでも有用性を示せた。 4
  6. 知識工学者のためのWikipediaカテゴリ構造の再 整理の構想 • Wikipediaのカテゴリ情報があまり利用されていない。 →カテゴリ階層構造に問題があるため。 • 問題解決のため、すべてのカテゴリをSet、Topic、 SaT(Set and Topic)に分類する。

    • 年次大会時点で作成中(半自動で)。 作成後、公開予定。 5 大阪の企業 日本ハム 北海道日本ハム ファイターズ 大谷翔平 (中略) (中略)
  7. 年次大会全体の感想 • 自然言語処理の研究分野をさらに知ることができた。 • 他大学の人や企業の人と交流することで研究に関係する情 報を得ることができた。 • これからの研究の進め方や発表の仕方について考える機会 を得られた。 6