chiVe の特長:実用で使えるものを目指す
6 GitHub で公開
商用利用可能ライセンス(Apache 2.0)
https://github.com/WorksApplications/chiVe
日本語形態素解析器
Sudachi
日本語大規模コーパス
NWJC
版
語彙数
v1.2 mc5
3,197,456
v1.2 mc15
1,454,280
v1.2 mc30
912,550
v1.2 mc90
482,223
chiVeは、
• 語彙数 48万~300万
• 大規模な学習データにより高品質
chiVeは、
• 複数粒度(A, B, C単位)に対応
• 表記正規化による表記ゆれの吸収