paper examines the introduction of “Easy Japanese” by extracting important segments for translation. The need for Japanese language has increased dramatically due to the recent influx of non-Japanese-speaking foreigners. Therefore, in order for non-native speakers of Japanese to successfully adapt to society, the so-called Easy Japanese is being developed to aid them in every aspect from basic conversation to translation of official documents. The materials of our project are the official documents since they are generally distributed in public offices, hospitals, and schools, where they include essential information that should be accessed for all residents. Through an analysis of Japanese language dependency as a pre-experiment, this paper introduces a translation by extracting important segments to facilitate the acquisition of Easy Japanese. Upon effective completion, the project will be introduced for use on the Internet and proposed for use by foreigners living in Japan as well as educators. Japanese English Input 保護者の判断で登校をみあわせて ください. Please avoid your children’s attendance in school with an assessment of the situation by a guardian. Japanese dependency analysis 保護者の -D By a guardian 判断で -D with an assessment of the situation 登校を -D your children’s attendance in school 見合わせください. Please avoid Output I 保護者の判断で見合わせてください. Please avoid with an assessment of the situation by a guardian. II 登校を見合わせてください. Please avoid your children’s attendance in school.
errors are often critical. We propose a phrase-based statistical MT method that preserves the modality of input sentences. The method introduces a feature function that counts the number of phrases in a sentence that are characteristic words for modalities. This simple method increases the number of translations that have the same modality as the input sentences. Question input: sa-kasu to doubutu en, dotti ni iko u ka . (The circus or the zoo, which shall we go to?) Existing SMT: Let’s go to the circus and, the zoo? (☓Affirmative) Our method: Which one shall we go to the circus and Zoo? (◦Querstion)
特徴語抽出手法を比較した。 入力文: サーカスと動物園、どっちに行こうか (疑問) ベースライン:Let's go to the circus and, the zoo? (肯定・不正解) 提案手法: Which one shall we go to the circus and Zoo? (疑問・正解)
まずそれぞれの関係名について関係インスタンスが共起する構文パタン (e.g. A に出ている B) をWeb6億ページ中か ら自動的に獲得し,関係名を表現する代表的な構文パタンのスコアが高くなるよう構文パタンに対し重み付けを行う. 次に関係名ごとに関係名を表現する構文パタンの順にランキングされた集合を構築する.質問が与えられるとその集 合をもとに質問文の構文パタンから該当する関係を特定し,回答となる関係インスタンスを提示する. 質問文:黒澤明が監督した映画は何? 羅生門 Film 監督 黒澤明 七人の侍 Film 監督 黒澤明 黒澤明 actoractress 民族 日本人 → 質問のトピック候補:黒澤明,映画,何 → 構文パタン:Aが監督したB,AはB,… Wikipedia Template 記事名 Template名 属性名 属性値 Template内を検索 Film 監督 A B 監督 0.163055 Film 監督 A B 撮る 0.070742 Film 監督 A B 0.015301 actoractress 民族 A B 出身 0.249877 actoractress 民族 A B 0.001523 Web6億ページから作られたパタン集合 関係 パタン スコア 提案手法の評価: 上位10件が全部正解だったという基準での精度が76.8%,MAP値が65.7%となり,提案手法の有効性を確認できた. パタン:A B 監督,A B 担当,A B,… 回答候補:羅生門,七人の侍(Film 監督), 日本人(actoractress 民族),… 羅生門 Film 出演者 = 0.163055+0.015301=0.178356 七人の侍 Film 出演者 = 0.163055+0.015301=0.178356 日本人 actoractress 民族 = 0.001523 回答候補が属す関係ごとに共起するパタンの スコアの合計値を計算,スコア順に回答を提示 回答:羅生門,七人の侍,日本人,… 関係を表現 する代表的な パタンのスコア が高い