UniDic ・・・1.3.9(パッケージ版) ◦ ChaSenのオプションで文字コードの問題を解消 ▪ −i w ・・・辞書がUTF-8でも正しく解析 ◦ 出力データの形式を変更 <cha:W1 orth="弁護" kana="ベンゴ" pron="ベンゴ" pos="名 詞-普通名詞-サ変可能" orthBase="弁護" kanaBase="ベンゴ" pronBase="ベンゴ" lForm="ベンゴ" lemma="弁護" form="ベン ゴ" aType="1" aConType="C1" goshu="漢">弁護</cha:W1>