Pointwise法を利用したベトナ ム語単語分割 L u Tuấ ấn Anh, Yamamoto Kazuhide ư Natural Language Processing Laboratory Department of Electrical Engineering 長岡技術科学大学 自然言語処理研究室 B4 Nguyen Van Hai 文献紹介
11 Experiments TABLE I. TRAINING DATA AND TEST DATA Training Test Size 7.7Mb 2.9Mb #Syllabels 1,404,406 535,600 #Words 1,071,195 410,088 ● データは2千万音節を単語分割した。