Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Foundation Model × VisionKit で実現するローカル OCR

Foundation Model × VisionKit で実現するローカル OCR

■ イベント
Sansan x DMM.swift #2 〜 テーマ: iOS × AI 〜
https://sansan.connpass.com/event/362644/

■ 発表者
技術本部 Eight Engineering Unit Mobile Applicationグループ
藤門 莉生

■ iOSエンジニア 採用情報
https://media.sansan-engineering.com/ios-engineer

Avatar for SansanTech

SansanTech PRO

August 06, 2025
Tweet

More Decks by SansanTech

Other Decks in Technology

Transcript

  1. 2 © Sansan, Inc. ⾃⼰紹介 - 名前:藤⾨ 莉⽣(Rio Fujimon) -

    所属:Eight Engineering Unit Mobile Application グループ - 担当:Eight の iOS 版アプリを開発 - 趣味:ランニング 🏃, 野球観戦 ⚾, etc
  2. 7 © Sansan, Inc. iOS 26 の登場 & Liquid Glass

    へのデザイン変更 出典:Apple公式サイト(https://www.apple.com/jp/newsroom/2025/06/apple-elevates-the-iphone-experience-with-ios-26/)
  3. 12 © Sansan, Inc. - Foundation Models とは? - オンデバイスの⼤規模⾔語モデル(Local

    LLM) - メリット - オフラインで動作する - プライバシーを完全保護する - OS に組み込まれているため、アプリサイズが増加しない - 型安全な構造化データが⽣成できる - デメリット - Server Scale の LLM より性能が低い - 得意なこと - 要約・分類・抽出 - 苦⼿なこと - ⾼度な推論・最新の知識・⼤規模計算 → Server Scale の LLM に任せる Foundation Models の概要
  4. 1. .streamResponse(to: ) -> sending LanguageModelSession.ResponseSteram で、 レスポンスのストリームを取得 2. for

    await ループを利⽤することで、逐次的な⽣成結果として、 Optional な Generable.PartiallyGenerated を取得
  5. 30 © Sansan, Inc. まとめ Foundation Models × Apple 標準の

    API で、 オンデバイスで可能な実装の幅が広がる 🔍