Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介:ベトナム語ツリーバンク
Search
Van Hai
September 16, 2015
0
330
文献紹介:ベトナム語ツリーバンク
Van Hai
September 16, 2015
Tweet
Share
More Decks by Van Hai
See All by Van Hai
文献紹介:Recurrent Neural Network based Language Model
nguyenvanhai
0
100
文献紹介:HMM Parameter Learning for Japanese Morphological Analyzer
nguyenvanhai
0
110
文献紹介:An Effective Neural Network Model for Graph-based Dependency Parsing.pdf
nguyenvanhai
0
160
文献紹介:Finding Synonyms Using Automatic Word Alignment and Measures of Distributional Similarity
nguyenvanhai
0
88
文献紹介:A Supervised Learning Approach to Automatic Synonym Identification based on Distributional Features
nguyenvanhai
0
170
文献紹介:Revisiting Word Embedding for Contrasting Meaning
nguyenvanhai
0
290
文献紹介:ベトナム語の品詞付与 JVnTagger
nguyenvanhai
0
420
文献紹介:Pointwise法を利用したベトナム語単語分割
nguyenvanhai
0
310
201506.pdf
nguyenvanhai
0
270
Featured
See All Featured
Six Lessons from altMBA
skipperchong
28
3.8k
Agile that works and the tools we love
rasmusluckow
329
21k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
657
60k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Writing Fast Ruby
sferik
628
61k
Typedesign – Prime Four
hannesfritz
42
2.7k
Raft: Consensus for Rubyists
vanstee
140
7k
Documentation Writing (for coders)
carmenintech
71
4.9k
The World Runs on Bad Software
bkeepers
PRO
68
11k
Gamification - CAS2011
davidbonilla
81
5.3k
YesSQL, Process and Tooling at Scale
rocio
172
14k
Transcript
ベトナム語のツリーバンク Nguyen Phuong Thai Vu Xuan Luong Nguyen Thi Minh
Huyen 長岡技術科学大学 自然言語処理研究室 Nguyen Van Hai 文献紹介
ベトナム語 •ツリーバンクは大切なもので機械翻訳や情報抽 出などに応用する •ベトナム語の単語の列が安定のためでツリーバ ンクを作成して構成木を選び •目的はベトナム語の10万語に語法を注釈する •政治と社会に関する新聞のコーパスを集まって 付与している
品詞 •品詞は2部を分ける • 結合と文法によって分ける • 意味によって分ける •品詞の中身で情報を持っているのは • 基礎な品詞:名詞、動詞 •
形態情報:単数、多数 • 子区分:名詞を結合する動詞、命題を結合する 動詞
表1 品詞種類
語法ラベル • そのラベルは語句と命題を記述する • 言語によって語句ラベルは誤差ことがある • 例えば中国ツリーバンクの機能ラベルがWHしかな いが英語ツリーバンクで機能ラベル4種類が WHNP, WHPP,
WHADJP, WHADVPある • 次のはベトナム語の語句ラベルと命題ラベル
表2 語句ラベル
表3 命題ラベル 語法機能ラベル •このラベルは文の中で1部の語法役割 •需要な部分を付与する •それによって語法の関係を確認できる • 主語と述語 • 福語 •
補完
表4 語法機能ラベル
表5 副詞ラベル
空き部分ラベル • “Tôi”の機能ラベルはSBJで”Tôi”は文の中で主語である • “quy n sách” ể の機能ラベルはOBJで 名詞の“quy
n ể sách”は文の中で対象である
None
評価 •両方の同じさは次の公式で評価する • C1:結果1のラベル • C2:結果2のラベル • C:両方の同じなラベル 例
結果 • 100文の中でTu i Tr ổ ẻという電子新聞と文法本を 取って実験すると次の表で同じさを結果でる • •
•