Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
類義表現分析の可能性
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
katsutan
February 02, 2017
Technology
0
310
類義表現分析の可能性
長岡技術科学大学 自然言語処理研究室 B3ゼミ発表2
katsutan
February 02, 2017
Tweet
Share
More Decks by katsutan
See All by katsutan
What does BERT learn about the structure of language?
katsutan
0
230
Simple and Effective Paraphrastic Similarity from Parallel Translations
katsutan
0
220
Simple task-specific bilingual word embeddings
katsutan
0
210
Retrofitting Contextualized Word Embeddings with Paraphrases
katsutan
0
260
Character Eyes: Seeing Language through Character-Level Taggers
katsutan
1
210
Improving Word Embeddings Using Kernel PCA
katsutan
0
230
Better Word Embeddings by Disentangling Contextual n-Gram Information
katsutan
0
320
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications
katsutan
0
270
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings
katsutan
0
300
Other Decks in Technology
See All in Technology
広告の効果検証を題材にした因果推論の精度検証について
zozotech
PRO
0
210
Cloud Runでコロプラが挑む 生成AI×ゲーム『神魔狩りのツクヨミ』の裏側
colopl
0
140
こんなところでも(地味に)活躍するImage Modeさんを知ってるかい?- Image Mode for OpenShift -
tsukaman
1
170
生成AIと余白 〜開発スピードが向上した今、何に向き合う?〜
kakehashi
PRO
0
160
今こそ学びたいKubernetesネットワーク ~CNIが繋ぐNWとプラットフォームの「フラッと」な対話
logica0419
5
480
SchooでVue.js/Nuxtを技術選定している理由
yamanoku
3
210
ECS障害を例に学ぶ、インシデント対応に備えたAIエージェントの育て方 / How to develop AI agents for incident response with ECS outage
iselegant
4
390
モダンUIでフルサーバーレスなAIエージェントをAmplifyとCDKでサクッとデプロイしよう
minorun365
4
220
予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善
muziyoshiz
1
2.1k
SREのプラクティスを用いた3領域同時 マネジメントへの挑戦 〜SRE・情シス・セキュリティを統合した チーム運営術〜
coconala_engineer
2
770
2026年、サーバーレスの現在地 -「制約と戦う技術」から「当たり前の実行基盤」へ- /serverless2026
slsops
2
270
OCI Database Management サービス詳細
oracle4engineer
PRO
1
7.4k
Featured
See All Featured
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
320
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
0
190
Visualization
eitanlees
150
17k
GitHub's CSS Performance
jonrohan
1032
470k
KATA
mclloyd
PRO
34
15k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.3k
For a Future-Friendly Web
brad_frost
182
10k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
Documentation Writing (for coders)
carmenintech
77
5.3k
Stop Working from a Prison Cell
hatefulcrawdad
273
21k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
950
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.2k
Transcript
類義表現分析の可能性 自然言語処理研究室 3年 勝田哲弘 1 2017/2/9
日本語教育における類義表現 一般に、類義表現は形態、統語、意味といった言語的な 特徴の類似性によって規定される。 例えば ハとヲ(ヲ格の助詞) ニとカラとニヨッテ(受動文における動作主マーカ)
バ、ト、ナラ、タラ(仮定条件を表す形式) サテ、デハ、シカシ、トコロデ(転換の接続詞) 文法項目の後ろに添えられる注釈からも形態、統語、意味 といった言語的な特徴を踏まえたものであることが分かる 2
日本語教育における類義表現 文法指導書に記述されている例 「なければならない」と「なければいけない」の違いは? 「なければならない」 会話的 「なければいけない」 改まった印象 「~ないで」と「~なくて」などの「~て」の用法
窓を{閉めないで/×閉めなくて}寝ました。 太郎は{合格しないで/合格しなくて}、次郎は合格した 3
日本語教育における類義表現 これらから次の2つの傾向が指摘できる。 レンマ(lemma)による文法記述が中心であり、出現形ごとの 記述は、ほとんど見られないといったこと。 シラバスや文法指導では、丁寧体、普通体などの活用形が一 つに集約され各出現形の情報が十分提供されていない。 正誤に関わる差異の記述が中心であり、出現形の使用環境
及び使用傾向に関する記述が少ないこと。 「ないで」「なくて」がどちらも使用可能な時、どのように使い分 けられているか。 4
コーパスデータに基づいた研究の位置づけ レンマ(lemma)による文法記述が中心であり、出現形ごとの記 述、ほとんど見られないといったこと。 大規模コーパスなどを用いた結果、意味・機能的に類似している 表現に差異が見られないことが多い。 正誤に関わる差異の記述が中心であり、出現形の使用環境及 び使用傾向に関する記述が少ないこと。 語彙項目と文法項目は独立したものである。
ある状況において好まれる組み合わせは相手の理解を容易に する。 ↓ コーパスを用いた量的調査は、 類義表現の差異の記述の有効手段。 5
類義表現分析 ある語や表現が使えるというのは、それを使うことができ るだけではなく、使うべきではないところでは使わないと いう2つの側面を持つ。 ↓ 使えそうな表現群をリストアップし、それらの差異を可視 化させることが重要になる。 6
類義表現を記述する観点 レンマではなく出現形に注目する。 量的調査に質的な分析を組み合わせる。 可視化された言語情報を基に使用傾向を記述する。 7
可視化された言語情報 抽象的な表現に偏ると具体的な使用場面が把握できな い。 「話し言葉/書き言葉」など。 明確な情報を積極的に用いることが必要。 使用されるジャンル
文内の出現位置 具体的な語とのコロケーション、文体など。 8
「海外」と「国外」の使い分け 9 「海外」と「国外」ともに共起する言葉 「海外生産」と「国外生産」 「海外市場」と「国外市場」など 一般的には海外が使われることが多い。しかし、文に
「国内」という意味と対比を表すか表現が使われた場合 は「国外」が用いられる。
まとめ 10 類義表現はレンマではなく出現形に注目して可視化され た言語情報を用いた記述をすることで、文法記述がより 具体的な使用場面も伴うものとなる。 コーパスを用いた量的調査は、客観性と再現性を備えて いるが類義表現分析には、分析者の判断が必要になる。
参考文献 「コーパスと日本語教育」 第3章 砂川有里子[編] 朝倉書店 11