Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
類義表現分析の可能性
Search
katsutan
February 02, 2017
Technology
0
300
類義表現分析の可能性
長岡技術科学大学 自然言語処理研究室 B3ゼミ発表2
katsutan
February 02, 2017
Tweet
Share
More Decks by katsutan
See All by katsutan
What does BERT learn about the structure of language?
katsutan
0
230
Simple and Effective Paraphrastic Similarity from Parallel Translations
katsutan
0
210
Simple task-specific bilingual word embeddings
katsutan
0
210
Retrofitting Contextualized Word Embeddings with Paraphrases
katsutan
0
260
Character Eyes: Seeing Language through Character-Level Taggers
katsutan
1
210
Improving Word Embeddings Using Kernel PCA
katsutan
0
220
Better Word Embeddings by Disentangling Contextual n-Gram Information
katsutan
0
320
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications
katsutan
0
260
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings
katsutan
0
290
Other Decks in Technology
See All in Technology
Kiro を用いたペアプロのススメ
taikis
4
1.9k
AWSインフルエンサーへの道 / load of AWS Influencer
whisaiyo
0
230
Connection-based OAuthから学ぶOAuth for AI Agents
flatt_security
0
390
AIBuildersDay_track_A_iidaxs
iidaxs
4
1.4k
20251222_サンフランシスコサバイバル術
ponponmikankan
2
140
特別捜査官等研修会
nomizone
0
580
AI with TiDD
shiraji
1
300
たまに起きる外部サービスの障害に備えたり備えなかったりする話
egmc
0
420
TED_modeki_共創ラボ_20251203.pdf
iotcomjpadmin
0
150
Amazon Bedrock Knowledge Bases × メタデータ活用で実現する検証可能な RAG 設計
tomoaki25
6
2.4k
20251218_AIを活用した開発生産性向上の全社的な取り組みの進め方について / How to proceed with company-wide initiatives to improve development productivity using AI
yayoi_dd
0
720
[Neurogica] 採用ポジション/ Recruitment Position
neurogica
1
130
Featured
See All Featured
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Context Engineering - Making Every Token Count
addyosmani
9
560
Music & Morning Musume
bryan
46
7k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.7k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
120
Optimising Largest Contentful Paint
csswizardry
37
3.5k
Balancing Empowerment & Direction
lara
5
820
Thoughts on Productivity
jonyablonski
73
5k
For a Future-Friendly Web
brad_frost
180
10k
AI: The stuff that nobody shows you
jnunemaker
PRO
1
28
How to build a perfect <img>
jonoalderson
0
4.7k
Designing for humans not robots
tammielis
254
26k
Transcript
類義表現分析の可能性 自然言語処理研究室 3年 勝田哲弘 1 2017/2/9
日本語教育における類義表現 一般に、類義表現は形態、統語、意味といった言語的な 特徴の類似性によって規定される。 例えば ハとヲ(ヲ格の助詞) ニとカラとニヨッテ(受動文における動作主マーカ)
バ、ト、ナラ、タラ(仮定条件を表す形式) サテ、デハ、シカシ、トコロデ(転換の接続詞) 文法項目の後ろに添えられる注釈からも形態、統語、意味 といった言語的な特徴を踏まえたものであることが分かる 2
日本語教育における類義表現 文法指導書に記述されている例 「なければならない」と「なければいけない」の違いは? 「なければならない」 会話的 「なければいけない」 改まった印象 「~ないで」と「~なくて」などの「~て」の用法
窓を{閉めないで/×閉めなくて}寝ました。 太郎は{合格しないで/合格しなくて}、次郎は合格した 3
日本語教育における類義表現 これらから次の2つの傾向が指摘できる。 レンマ(lemma)による文法記述が中心であり、出現形ごとの 記述は、ほとんど見られないといったこと。 シラバスや文法指導では、丁寧体、普通体などの活用形が一 つに集約され各出現形の情報が十分提供されていない。 正誤に関わる差異の記述が中心であり、出現形の使用環境
及び使用傾向に関する記述が少ないこと。 「ないで」「なくて」がどちらも使用可能な時、どのように使い分 けられているか。 4
コーパスデータに基づいた研究の位置づけ レンマ(lemma)による文法記述が中心であり、出現形ごとの記 述、ほとんど見られないといったこと。 大規模コーパスなどを用いた結果、意味・機能的に類似している 表現に差異が見られないことが多い。 正誤に関わる差異の記述が中心であり、出現形の使用環境及 び使用傾向に関する記述が少ないこと。 語彙項目と文法項目は独立したものである。
ある状況において好まれる組み合わせは相手の理解を容易に する。 ↓ コーパスを用いた量的調査は、 類義表現の差異の記述の有効手段。 5
類義表現分析 ある語や表現が使えるというのは、それを使うことができ るだけではなく、使うべきではないところでは使わないと いう2つの側面を持つ。 ↓ 使えそうな表現群をリストアップし、それらの差異を可視 化させることが重要になる。 6
類義表現を記述する観点 レンマではなく出現形に注目する。 量的調査に質的な分析を組み合わせる。 可視化された言語情報を基に使用傾向を記述する。 7
可視化された言語情報 抽象的な表現に偏ると具体的な使用場面が把握できな い。 「話し言葉/書き言葉」など。 明確な情報を積極的に用いることが必要。 使用されるジャンル
文内の出現位置 具体的な語とのコロケーション、文体など。 8
「海外」と「国外」の使い分け 9 「海外」と「国外」ともに共起する言葉 「海外生産」と「国外生産」 「海外市場」と「国外市場」など 一般的には海外が使われることが多い。しかし、文に
「国内」という意味と対比を表すか表現が使われた場合 は「国外」が用いられる。
まとめ 10 類義表現はレンマではなく出現形に注目して可視化され た言語情報を用いた記述をすることで、文法記述がより 具体的な使用場面も伴うものとなる。 コーパスを用いた量的調査は、客観性と再現性を備えて いるが類義表現分析には、分析者の判断が必要になる。
参考文献 「コーパスと日本語教育」 第3章 砂川有里子[編] 朝倉書店 11