Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
用言等換言辞書を人手で作りました
Search
自然言語処理研究室
March 31, 2013
Research
65
0
Share
用言等換言辞書を人手で作りました
山本和英, 吉倉 孝太郎,. 用言等換言辞書を人手で作りました. 言語処理学会第19回年次大会, pp.276-279 (2013.3)
自然言語処理研究室
March 31, 2013
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
410
データサイエンス13_解析.pdf
jnlp
0
530
データサイエンス12_分類.pdf
jnlp
0
370
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
160
自然言語処理研究室 研究概要(2012年)
jnlp
0
160
自然言語処理研究室 研究概要(2013年)
jnlp
0
120
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
230
Other Decks in Research
See All in Research
Dual Quadric表現を用いた動的物体追跡とRGB-D・IMU制約の密結合によるオドメトリ推定
nanoshimarobot
0
350
生成AI による論文執筆サポート・ワークショップ 論文執筆・推敲編 / Generative AI-Assisted Paper Writing Support Workshop: Drafting and Revision Edition
ks91
PRO
0
200
データセンター事業者を取り巻く近年の状況とその中での研究開発動向、テストベッドへの貢献の可能性
kikuzo
1
120
非試合日の野球場を楽しむためのARホームランボールキャッチ体験システムの開発 / EC79-miyazaki
yumulab
0
170
ブレグマン距離最小化に基づくリース表現量推定:バイアス除去学習の統一理論
masakat0
0
250
Data Visualization Tools in the Age of AI
flekschas
0
140
Using our influence and power for patient safety
helenbevan
0
340
機械学習で作った ポケモン対戦bot で 遊ぼう!
fufufukakaka
0
180
さくらインターネット研究所テックトーク2026春、研究開発Gr.25年度成果26年度方針
kikuzo
0
130
Thirty Years of Progress in Speech Synthesis: A Personal Perspective on the Past, Present, and Future
ktokuda
0
210
それ、チームの改善になってますか?ー「チームとは?」から始めた組織の実験ー
hirakawa51
0
1.1k
Tiaccoon: Unified Access Control with Multiple Transports in Container Networks
hiroyaonoe
0
1.6k
Featured
See All Featured
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
1k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.4k
My Coaching Mixtape
mlcsv
0
120
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
280
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
160
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
370
Color Theory Basics | Prateek | Gurzu
gurzu
0
310
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
120
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Transcript
(c)長岡技術科学大学 電気系 1/26 用言等換言辞書を 人手で作りました 山本和英 吉倉孝太郎 長岡技術科学大学
(c)長岡技術科学大学 電気系 2/26 発表内容: 1. 換言処理の話 2. 作業内容 3. 結果と今後
(c)長岡技術科学大学 電気系 3/26 1. 換言処理の話
(c)長岡技術科学大学 電気系 4/26 研究の動機: 換言処理したいのに、 一般に利用可能な 汎用日本語換言辞書が 存在しない
(c)長岡技術科学大学 電気系 5/26 なぜ換言処理? 表現の多様性は 自然言語の特質である。 これを正面から扱わない限り、 自然言語処理は進展しない。
(c)長岡技術科学大学 電気系 6/26 表層表現 いわゆる意味表現 以後の 処理へ 理解 理想
(c)長岡技術科学大学 電気系 7/26 表層表現 いわゆる意味表現 理解 現実
(c)長岡技術科学大学 電気系 8/26 表層表現 いわゆる意味表現 理解 現実 これで いいのか?
(c)長岡技術科学大学 電気系 9/26 表層表現 多様性を吸収した 言語表現 いわゆる意味表現 換言処理 理解 提案
(c)長岡技術科学大学 電気系 10/26 表層表現 多様性を吸収した 言語表現 いわゆる意味表現 換言処理 理解 提案
性能向上 するのでは?
(c)長岡技術科学大学 電気系 11/26 主張:換言処理は、 • 自然言語処理の性能向上に大いに 寄与する。 • 表現平易化(やさしい日本語)や表 現統一(産業日本語)などは社会で
の需要が大きい。 よって、換言処理の進展がどうしても必 要だ。
(c)長岡技術科学大学 電気系 12/26 2. 作業内容
(c)長岡技術科学大学 電気系 13/26 作業の概要 • サ変名詞、動詞、形容詞、副詞を対象 • JUMAN辞書項目が換言対象 – 合計約12,000語
• 1名が手作業で換言 • 短く置換できる語を思い出す • 平易に換言する(難しく換言しない)
(c)長岡技術科学大学 電気系 14/26 言語資源を参照しない 作成時に国語辞典やシソーラスを一切見 ないで作業を行う。直感勝負。 • 作業効率の向上 • 既存の言語資源と同じ情報がほしいの
ではない
(c)長岡技術科学大学 電気系 15/26 無記入を許す • 単語の意味が分からない – 笑み割れる、かがる • 換言できる語を思いつかない
– 投げる、言う、話す • 換言可能でも長い説明を要する – 一進一退する 以上のいずれかに該当する場合に無記入を許 す。
(c)長岡技術科学大学 電気系 16/26 多義語は文脈を付与する • 空を仰ぐ ⇒ 見る • 師匠を仰ぐ ⇒ 尊敬する • 指示を仰ぐ ⇒ 求める
多義語の場合は換言語と共に文脈(赤 字)を記述する。
(c)長岡技術科学大学 電気系 17/26 格変化は記述する • 背く ⇒ 裏切る • 上司に背く ⇒ 上司を裏切る 換言によって格が変化する場合は、 格の変化も記述する。
(c)長岡技術科学大学 電気系 18/26 慣用的表現は まとめて換言する • 入れる ⇒ ? • 手に入れる ⇒ 得る 単語単位で換言できない(広い意味の)
慣用的表現はまとめて換言する。
(c)長岡技術科学大学 電気系 19/26 意味の重複可能性も 付記する • 片付ける ⇒ きれいにする • 部屋を片付ける
⇒ 部屋をきれいにする
(c)長岡技術科学大学 電気系 20/26 意味の重複可能性も 付記する • 片付ける ⇒ きれいにする • 部屋を片付ける
⇒ 部屋をきれいにする • 部屋をきれいに片付ける ⇒ 部屋をきれいにきれいにする 意味が重複して表出する可能性がある 表現は括弧づけする。
(c)長岡技術科学大学 電気系 21/26 3. 結果と今後
(c)長岡技術科学大学 電気系 22/26 作業結果 品詞 換言対象 換言作成 無記入 動詞 3,608語
3,206語 481語 サ変名詞 5,627語 4,494語 1,141語 形容詞 2,335語 1,851語 496語 副詞 1,243語 785語 463語 合計 12,813語 10,336語 2,585語 作業期間:5ヶ月程度
(c)長岡技術科学大学 電気系 23/26 辞書の分析 これからです。 • 国語辞典・シソーラスとの関係 • 日本語の基礎語彙との関係
(c)長岡技術科学大学 電気系 24/26 辞書の利用 これからです。 • 人に向けた換言 (表現の平易化、規格化など) • 計算機に向けた換言
(自然言語処理の性能向上)
(c)長岡技術科学大学 電気系 25/26 名詞は換言しないのか? • 名詞も換言辞書を作りたいが、用言等 ほど換言は簡単ではない。 • 検討中。
(c)長岡技術科学大学 電気系 26/26 発表まとめ 用言等換言辞書を 人手で作りました。