Slide 19
Slide 19 text
事前に用意されたデータセットを基準に
日本語住所を「longest match」し、下
位Nodeが無くなるまで繰り返す
住所のデータセットは 日本語 : 英語 形
式のオブジェクトになる
「Longest Match」とは?
入力文字列の先頭から、一番長く一致する部分を探す手法
例えば「福岡県福岡市中央区」の場合:
1. 最上位Nodeでは「福岡県」が一致する -> 「Fukuoka-ken」を返す
2. 下位Nodeでは「福岡市」が一致する -> 「Fukuoka-shi」を返す
3. 下位Nodeでは「中央区」が一致する -> 「chuo-ku」を返す
これにより、市市(イチシ)のように行政区画名が入る地名も安全に検索ができる
巨大な住所の世界へ - 苦労した部分