Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介:ベトナム語ツリーバンク
Search
Van Hai
September 16, 2015
0
340
文献紹介:ベトナム語ツリーバンク
Van Hai
September 16, 2015
Tweet
Share
More Decks by Van Hai
See All by Van Hai
文献紹介:Recurrent Neural Network based Language Model
nguyenvanhai
0
110
文献紹介:HMM Parameter Learning for Japanese Morphological Analyzer
nguyenvanhai
0
120
文献紹介:An Effective Neural Network Model for Graph-based Dependency Parsing.pdf
nguyenvanhai
0
180
文献紹介:Finding Synonyms Using Automatic Word Alignment and Measures of Distributional Similarity
nguyenvanhai
0
110
文献紹介:A Supervised Learning Approach to Automatic Synonym Identification based on Distributional Features
nguyenvanhai
0
190
文献紹介:Revisiting Word Embedding for Contrasting Meaning
nguyenvanhai
0
310
文献紹介:ベトナム語の品詞付与 JVnTagger
nguyenvanhai
0
440
文献紹介:Pointwise法を利用したベトナム語単語分割
nguyenvanhai
0
320
201506.pdf
nguyenvanhai
0
270
Featured
See All Featured
Between Models and Reality
mayunak
2
250
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
150
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
91
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
1.9k
Paper Plane
katiecoart
PRO
0
48k
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.5k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
430
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
170
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.4k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
The Curious Case for Waylosing
cassininazir
0
280
Transcript
ベトナム語のツリーバンク Nguyen Phuong Thai Vu Xuan Luong Nguyen Thi Minh
Huyen 長岡技術科学大学 自然言語処理研究室 Nguyen Van Hai 文献紹介
ベトナム語 •ツリーバンクは大切なもので機械翻訳や情報抽 出などに応用する •ベトナム語の単語の列が安定のためでツリーバ ンクを作成して構成木を選び •目的はベトナム語の10万語に語法を注釈する •政治と社会に関する新聞のコーパスを集まって 付与している
品詞 •品詞は2部を分ける • 結合と文法によって分ける • 意味によって分ける •品詞の中身で情報を持っているのは • 基礎な品詞:名詞、動詞 •
形態情報:単数、多数 • 子区分:名詞を結合する動詞、命題を結合する 動詞
表1 品詞種類
語法ラベル • そのラベルは語句と命題を記述する • 言語によって語句ラベルは誤差ことがある • 例えば中国ツリーバンクの機能ラベルがWHしかな いが英語ツリーバンクで機能ラベル4種類が WHNP, WHPP,
WHADJP, WHADVPある • 次のはベトナム語の語句ラベルと命題ラベル
表2 語句ラベル
表3 命題ラベル 語法機能ラベル •このラベルは文の中で1部の語法役割 •需要な部分を付与する •それによって語法の関係を確認できる • 主語と述語 • 福語 •
補完
表4 語法機能ラベル
表5 副詞ラベル
空き部分ラベル • “Tôi”の機能ラベルはSBJで”Tôi”は文の中で主語である • “quy n sách” ể の機能ラベルはOBJで 名詞の“quy
n ể sách”は文の中で対象である
None
評価 •両方の同じさは次の公式で評価する • C1:結果1のラベル • C2:結果2のラベル • C:両方の同じなラベル 例
結果 • 100文の中でTu i Tr ổ ẻという電子新聞と文法本を 取って実験すると次の表で同じさを結果でる • •
•