Upgrade to Pro — share decks privately, control downloads, hide ads and more …

StreamlitとLangChainを使った表画像OCRアプリの実装

熊懐葵
October 26, 2024

 StreamlitとLangChainを使った表画像OCRアプリの実装

機械学習の社会実装勉強会 第40回 (https://machine-learning-workshop.connpass.com/event/334075/) の発表資料です。

熊懐葵

October 26, 2024
Tweet

More Decks by 熊懐葵

Other Decks in Technology

Transcript

  1. 目次 • 背景 • 課題 • 実装のモチベーション • 実装 •

    実装のイメージ • 実装の説明 • 応用例: 財務諸表のOCR • まとめ
  2. 背景 データ入力…業界や職種問わず広く行われている基本的な業務 紙ベース・表画像 データ(デジタル) 手入力 事務 • 申請書 • 領収書

    医療 • カルテ • 診断書 会計・監査 • 財務資料 • 取引記録 研究 • 実験記録 • 観察記録
  3. 目次 • 背景 • 課題 • 実装のモチベーション • 実装 •

    実装のイメージ • 実装の説明 • 応用例: 財務諸表のOCR • まとめ
  4. 実装2: 表画像をLLMに読み込ませる • LLM: LangChainのLCEL記法 LLMを定義 プロンプト + モデル プロンプト(prompt)

    • system プロンプト(テキスト) • human プロンプト(テキスト+画像) モデル(chat) • モデル名 • パラメータ
  5. 目次 • 背景 • 課題 • 実装のモチベーション • 実装 •

    実装のイメージ • 実装の説明 • 応用例: 財務諸表のOCR • まとめ