Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介:ベトナム語ツリーバンク
Search
Van Hai
September 16, 2015
0
340
文献紹介:ベトナム語ツリーバンク
Van Hai
September 16, 2015
Tweet
Share
More Decks by Van Hai
See All by Van Hai
文献紹介:Recurrent Neural Network based Language Model
nguyenvanhai
0
100
文献紹介:HMM Parameter Learning for Japanese Morphological Analyzer
nguyenvanhai
0
110
文献紹介:An Effective Neural Network Model for Graph-based Dependency Parsing.pdf
nguyenvanhai
0
170
文献紹介:Finding Synonyms Using Automatic Word Alignment and Measures of Distributional Similarity
nguyenvanhai
0
97
文献紹介:A Supervised Learning Approach to Automatic Synonym Identification based on Distributional Features
nguyenvanhai
0
170
文献紹介:Revisiting Word Embedding for Contrasting Meaning
nguyenvanhai
0
300
文献紹介:ベトナム語の品詞付与 JVnTagger
nguyenvanhai
0
430
文献紹介:Pointwise法を利用したベトナム語単語分割
nguyenvanhai
0
310
201506.pdf
nguyenvanhai
0
270
Featured
See All Featured
Building a Modern Day E-commerce SEO Strategy
aleyda
43
7.7k
4 Signs Your Business is Dying
shpigford
185
22k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
860
Measuring & Analyzing Core Web Vitals
bluesmoon
9
620
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.4k
Practical Orchestrator
shlominoach
190
11k
Context Engineering - Making Every Token Count
addyosmani
5
220
Being A Developer After 40
akosma
91
590k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
33
2.5k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Rails Girls Zürich Keynote
gr2m
95
14k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.5k
Transcript
ベトナム語のツリーバンク Nguyen Phuong Thai Vu Xuan Luong Nguyen Thi Minh
Huyen 長岡技術科学大学 自然言語処理研究室 Nguyen Van Hai 文献紹介
ベトナム語 •ツリーバンクは大切なもので機械翻訳や情報抽 出などに応用する •ベトナム語の単語の列が安定のためでツリーバ ンクを作成して構成木を選び •目的はベトナム語の10万語に語法を注釈する •政治と社会に関する新聞のコーパスを集まって 付与している
品詞 •品詞は2部を分ける • 結合と文法によって分ける • 意味によって分ける •品詞の中身で情報を持っているのは • 基礎な品詞:名詞、動詞 •
形態情報:単数、多数 • 子区分:名詞を結合する動詞、命題を結合する 動詞
表1 品詞種類
語法ラベル • そのラベルは語句と命題を記述する • 言語によって語句ラベルは誤差ことがある • 例えば中国ツリーバンクの機能ラベルがWHしかな いが英語ツリーバンクで機能ラベル4種類が WHNP, WHPP,
WHADJP, WHADVPある • 次のはベトナム語の語句ラベルと命題ラベル
表2 語句ラベル
表3 命題ラベル 語法機能ラベル •このラベルは文の中で1部の語法役割 •需要な部分を付与する •それによって語法の関係を確認できる • 主語と述語 • 福語 •
補完
表4 語法機能ラベル
表5 副詞ラベル
空き部分ラベル • “Tôi”の機能ラベルはSBJで”Tôi”は文の中で主語である • “quy n sách” ể の機能ラベルはOBJで 名詞の“quy
n ể sách”は文の中で対象である
None
評価 •両方の同じさは次の公式で評価する • C1:結果1のラベル • C2:結果2のラベル • C:両方の同じなラベル 例
結果 • 100文の中でTu i Tr ổ ẻという電子新聞と文法本を 取って実験すると次の表で同じさを結果でる • •
•