Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介:ベトナム語ツリーバンク
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Van Hai
September 16, 2015
340
0
Share
文献紹介:ベトナム語ツリーバンク
Van Hai
September 16, 2015
More Decks by Van Hai
See All by Van Hai
文献紹介:Recurrent Neural Network based Language Model
nguyenvanhai
0
110
文献紹介:HMM Parameter Learning for Japanese Morphological Analyzer
nguyenvanhai
0
120
文献紹介:An Effective Neural Network Model for Graph-based Dependency Parsing.pdf
nguyenvanhai
0
180
文献紹介:Finding Synonyms Using Automatic Word Alignment and Measures of Distributional Similarity
nguyenvanhai
0
120
文献紹介:A Supervised Learning Approach to Automatic Synonym Identification based on Distributional Features
nguyenvanhai
0
190
文献紹介:Revisiting Word Embedding for Contrasting Meaning
nguyenvanhai
0
310
文献紹介:ベトナム語の品詞付与 JVnTagger
nguyenvanhai
0
440
文献紹介:Pointwise法を利用したベトナム語単語分割
nguyenvanhai
0
320
201506.pdf
nguyenvanhai
0
270
Featured
See All Featured
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
220
Rails Girls Zürich Keynote
gr2m
96
14k
Typedesign – Prime Four
hannesfritz
42
3k
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.2k
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
410
Between Models and Reality
mayunak
3
270
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.2k
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.5k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
180
[SF Ruby Conf 2025] Rails X
palkan
2
980
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
61
43k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
Transcript
ベトナム語のツリーバンク Nguyen Phuong Thai Vu Xuan Luong Nguyen Thi Minh
Huyen 長岡技術科学大学 自然言語処理研究室 Nguyen Van Hai 文献紹介
ベトナム語 •ツリーバンクは大切なもので機械翻訳や情報抽 出などに応用する •ベトナム語の単語の列が安定のためでツリーバ ンクを作成して構成木を選び •目的はベトナム語の10万語に語法を注釈する •政治と社会に関する新聞のコーパスを集まって 付与している
品詞 •品詞は2部を分ける • 結合と文法によって分ける • 意味によって分ける •品詞の中身で情報を持っているのは • 基礎な品詞:名詞、動詞 •
形態情報:単数、多数 • 子区分:名詞を結合する動詞、命題を結合する 動詞
表1 品詞種類
語法ラベル • そのラベルは語句と命題を記述する • 言語によって語句ラベルは誤差ことがある • 例えば中国ツリーバンクの機能ラベルがWHしかな いが英語ツリーバンクで機能ラベル4種類が WHNP, WHPP,
WHADJP, WHADVPある • 次のはベトナム語の語句ラベルと命題ラベル
表2 語句ラベル
表3 命題ラベル 語法機能ラベル •このラベルは文の中で1部の語法役割 •需要な部分を付与する •それによって語法の関係を確認できる • 主語と述語 • 福語 •
補完
表4 語法機能ラベル
表5 副詞ラベル
空き部分ラベル • “Tôi”の機能ラベルはSBJで”Tôi”は文の中で主語である • “quy n sách” ể の機能ラベルはOBJで 名詞の“quy
n ể sách”は文の中で対象である
None
評価 •両方の同じさは次の公式で評価する • C1:結果1のラベル • C2:結果2のラベル • C:両方の同じなラベル 例
結果 • 100文の中でTu i Tr ổ ẻという電子新聞と文法本を 取って実験すると次の表で同じさを結果でる • •
•