(OCR) • OCR is easy if we have one layout • We can simply crop the same text area and read the text for each image { "小計": 23,450,000, "消費税": 2,345,000, "合計": 25,795,000 } • 光学式文字認識 (OCR) • レイアウトが統一されていれば、 OCRは簡単 • 同じテキストエリアを切り抜いて、テキストを読み 取るだけ
are a lot of layouts, it is hard for the model to learn • We are building in-house AI-OCR models to serve our customers 実際はデータセットには何百種類ものレイアウトが存在する However, there are hundreds of unique layouts in our dataset