Amazon Bedrock で作る未来の開発サイクルと オペレーション戦略 / AWS Summit Japan 2025
by
Yoshiki Nakagawa
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
© LayerX Inc. Amazon Bedrock で作る未来の開発サイクルと オペレーション戦略 中川 佳希 / 株式会社 LayerX AWS Summit Japan 2025
Slide 2
Slide 2 text
2 © LayerX Inc. 自己紹介 中川 佳希 / ナカガワ ヨシキ @yyoshiki41 株式会社 LayerX 執行役員 バクラク事業 CTO 自己紹介 2020年6月入社。プロダクトチームのテックリードや 開発チーム横断組織であるEnabling Teamを経て、 2024年1月にバクラク事業部CTOに就任。
Slide 3
Slide 3 text
目次 Agenda • 事業紹介 • パーソナライズド AI-OCR • アノテーション基盤における Amazon Bedrock の活用 • 機械学習を支えるエンジニアリング
Slide 4
Slide 4 text
会社紹介
Slide 5
Slide 5 text
5 © LayerX Inc. すべての経済活動を、デジタル化する。 会社概要 会社名 株式会社LayerX(レイヤーエックス) 代表取締役 代表取締役CEO 福島 良典 代表取締役CTO 松本 勇気 創業 2018年 8月1日 資本金 約132.6億円 拠点 東京本社 〒104-0045 東京都中央区築地1-13-1 銀座松竹スクエア 5階 関西支社 〒530-0002 大阪府大阪市北区曽根崎新地1-13-22 御堂筋フロントタワー 内 中部支社 〒466-0064 愛知県名古屋市昭和区鶴舞1-2−32 STATION Ai 内 九州支社 〒810-0801 福岡県福岡市博多区中洲3-7-24 WeWorkゲイツ福岡 11F 内 従業員数 385名 (2024年10月末時点)
Slide 6
Slide 6 text
6 © LayerX Inc. 「すべての経済活動を、デジタル化する。」をミッションに、AI SaaS / AI DX 事業を展開 事業紹介 バクラク事業 企業活動のインフラとなる業務を 効率化するクラウドサービス Fintech事業 ソフトウェアを駆使した アセットマネジメント・証券事業を 合弁会社にて展開 AI・LLM事業 社内のナレッジやノウハウをデータ ベース化するAIプラットフォーム AI SaaSドメイン AI DXドメイン
Slide 7
Slide 7 text
© LayerX Inc. 7 バクラク バックオフィスから 全社の生産性を高める。 バクラクは、稟議、経費精算、法人カード、 請求書受取、請求書発行、勤怠管理などの業 務を効率化するクラウドサービスです。 最先端のAIを組み込むことで、手入力や紙の 管理などの業務から解放し、従業員一人ひと りがコア業務に集中できる新しい働き方を創 造します。 中小企業から大企業まで、15,000社を超える お客様の働きやすい環境づくりと事業成長を 支援しています。
Slide 8
Slide 8 text
© LayerX Inc. 8 バクラクシリーズラインナップ バクラク
Slide 9
Slide 9 text
Introduction
Slide 10
Slide 10 text
© LayerX Inc. 10
Slide 11
Slide 11 text
© LayerX Inc. 11 スキャン請求書の AI 分割 AIが全ページを読み取り、分割 位置を推薦。人が取込単位に前 捌きを行う手間をなくします。 取り込み単位の前捌きは不要。 まとめて一度にスキャンできる。
Slide 12
Slide 12 text
© LayerX Inc. 12 スマホで簡単申請 連続撮影 & AI-OCR 複数のレシートを連続撮影し、一括取り 込みしてアップロード。 費用の内訳も推薦され入力は不要。 ワンタップで申請が完了します。
Slide 13
Slide 13 text
© LayerX Inc. 13 一括アップロード AI-OCRが自動データ入力 バクラク経費精算の スマホアプリを立ち上げ なめらかに連続撮影 STEP.1 ボタンを押すと写真を 連続撮影、取り込みが可能 同時に複数レシートを 読み込み、自動データ化 アイコン長押しで ショートカットでカメラを起動 STEP.2 STEP.3 スマホで3ステップ簡単申請。連続撮影&AI-OCR
Slide 14
Slide 14 text
© LayerX Inc. 14 バクラクで実現する世界
Slide 15
Slide 15 text
© LayerX Inc. 15 パーソナライズド AI-OCR 単なる項目抽出ではなく、ユースケース に合わせ値を読み取ることが可能に。 お客様ごとの運用に合わせて学習します。 複数の値を同時に読み込み AI が推薦 STEP.1 お客様の選択を学習していき 運用に最適化していく STEP.2 *特許出願中
Slide 16
Slide 16 text
© LayerX Inc. 16 ホテルの領収書で読み取りたいのは チェックアウト日 or 決済日 CASE.1 請求書で読み取りたいのは 税抜請求金額 or 税込請求金額 CASE.2 書類ごとの細かいユースケースを学習 パーソナライズド AI-OCR のユースケース
Slide 17
Slide 17 text
パーソナライズド AI-OCR の背景
Slide 18
Slide 18 text
© LayerX Inc. 18 帳票内には複数の類似した情報が含まれる パーソナライズド AI-OCR 「金額」を 読み取ってほしい 「会社名」 「金額」「日付」として丸められる文字列は複数あり、 求める解はユーザーにより異なる
Slide 19
Slide 19 text
© LayerX Inc. 19 帳票内には複数の類似した情報が含まれる パーソナライズド AI-OCR 税込金額 税抜金額 今回請求金額 (前月繰越額を引く) 合計金額 (源泉徴収額を引く) ユーザーの求める解を導くには、細分化した分類でのデータセットが求められる 「金額」
Slide 20
Slide 20 text
© LayerX Inc. 20 帳票内には複数の類似した情報が含まれる パーソナライズド AI-OCR ユーザーの求める解を得るために、1つの帳票から多くの項目を抽出 (extract) 「だれに」「いつ」「いくら」支払うかといった意味を理解 (understand) する必要がある 会社名 or 担当者名 請求金額 or 今回請求金額
Slide 21
Slide 21 text
© LayerX Inc. 21 パーソナライズド AI-OCR (推薦モデル) パーソナライズド AI-OCR また、ユーザーの求める解を得るため推薦モデルにはユーザーの過去入力履歴を利用 税抜金額 会社名 税抜金額 担当者名 税込金額 会社名 n 回目 ... 税抜金額 会社名 過去学習から推薦 会社名 or 担当者名
Slide 22
Slide 22 text
© LayerX Inc. 22 パーソナライズド AI-OCR (推薦モデル) パーソナライズド AI-OCR 実際に銀行振込で支払うのは 平日である26日(金) ユーザーが本当に欲しているのは「実際の運用にそくした値」 帳票のうえでは支払期日は 28日(日)となっているが
Slide 23
Slide 23 text
AI-OCR を支えるアノテーション基盤
Slide 24
Slide 24 text
© LayerX Inc. 24 機械学習モデルのための学習、検証用データセット アノテーション基盤 自社で機械学習モデルを作成しているため、学習と検証用のデータセットが必須 帳票から必要な情報(項目)を抽出し、それぞれに正しいラベル(分類)を付与する ”アノテーション” 作業が発生する 機械学習モデル構築のボトルネックとなるが、 帳票の種類も数も多く、解釈も複数考えられ、アノテーション作業は簡単ではない
Slide 25
Slide 25 text
© LayerX Inc. 25 機械学習モデルのための学習、検証用データセット アノテーション基盤 正確なアノテーションデータ(座標・値)をより効率的に作るためシステムを内製 読み取り項目ごとに座標と値の入力をサポート ユーザーの入力値のサジェスト、 バウンディングボックスで文字の領域を囲み、 視覚的なサポートも行い作業負荷を軽減
Slide 26
Slide 26 text
© LayerX Inc. 26 構造データ化 アノテーションデータの作成 アノテーション基盤 アノテーション 文字列の抽出 非構造データから正規化された構造データを得る 税抜金額 1,000 税込金額 1,100 ... ...
Slide 27
Slide 27 text
© LayerX Inc. 27 アノテーションデータの作成 アノテーション基盤 ■ アノテーション項目が増えた中で、人手で行う場合の課題 ・項目数増により、帳票1枚あたりの作業時間が増加 ・項目の種類が増えることにより、正しいラベルを選ぶ難易度が上がった ・新たな種類の項目はスタート時、推論可能なモデルやユーザーの入力値がなく、候補をサ ジェスト出来ないためアノテーション作業の難易度が上がる
Slide 28
Slide 28 text
© LayerX Inc. 28 LLM(大規模言語モデル)の活用 アノテーション基盤 アノテーション項目が増えた中での課題を解決するため、LLM を活用 ■ Steps 1. 帳票ファイルに OCR を実行、テキスト化 2. テキスト化されたデータと抽出項目を定義したプロンプトを LLM に与える 3. アノテーションデータを得る
Slide 29
Slide 29 text
© LayerX Inc. 29 構造データ化 アノテーションデータの作成 アノテーション基盤 LLM による推論 文字列の抽出 非構造データから正規化された構造データを得る 税抜金額 1,000 税込金額 1,100 ... ...
Slide 30
Slide 30 text
© LayerX Inc. 30 LLM(大規模言語モデル)の活用 アノテーション基盤 ■ アノテーションデータの作成における課題を解消 ・新たな種類のアノテーション項目でもゼロショットで、値を推論させることが可能 ・擬似的な正解ラベルとして、アノテーション完了を待たず、早期にモデルトレーニングが 可能、リードタイムを短縮できる ・アノテーションの方法やモデルの選定の方向性に問題がないかの検証が行える ・求めるアノテーションデータを JSON Schemaで定義し、構造化した出力を指示できる ・ハルシネーション対策として JSON Schema に意味的なバリデーションの仕組みを導入
Slide 31
Slide 31 text
Amazon Bedrock の活用
Slide 32
Slide 32 text
© LayerX Inc. 32 Amazon Bedrock を用いたアノテーションタスク Amazon Bedrock ■ Amazon Bedrock の特徴 ・AWS アジアパシフィック (東京) リージョンで処理、海外へのデータ越境がない ・LLM モデルプロバイダーの API キー発行が不要、IAM でのリソースアクセス制御が行える ・最新の Claude モデルが利用できる ・Claude JSON mode により出力フォーマットが指定可能、構造化されたアノテーション データが得られる
Slide 33
Slide 33 text
© LayerX Inc. 33 フルマネージドな AWS 内で完結するアーキテクチャ Amazon Bedrock ■ Steps 1. 開発者が AWS Step Functions を起動 2. AWS Fargate タスクを実行 3. Amazon S3 からテキストデータを取得 4. Amazon Bedrock での推論 5. Amazon Aurora に結果を保存
Slide 34
Slide 34 text
© LayerX Inc. 34 Amazon Bedrock 活用でのインパクト Amazon Bedrock ■ 時間短縮とコスト圧縮 1,000 枚の帳票に対するアノテーションは、わずか 1.5 時間ほど 人間が行う場合、1000枚から40項目を抽出するとなるとおおよそ 165時間 (1日8時間 × 5日間 × 4人分の仕事量)
Slide 35
Slide 35 text
AI-OCR における LLM 活用の今後
Slide 36
Slide 36 text
© LayerX Inc. 36 LLM による推論結果をそのままユーザーに提供するか? AI-OCR における LLM 活用の今後 ユーザーに提供するために取れるアプローチは? > マルチモーダル? Few-shot prompting? プロンプトエンジニアリング? 現状では、ユーザーにパーソナライズドさせた結果を返す水準に至らない 自社ドメインのデータで学習した従来の機械学習モデルの方が、精度の面で高いことが多い またリクエスト量が多く、レイテンシの速さも求められる ※ 現行 AI-OCR は、最大でも 5秒以内を維持
Slide 37
Slide 37 text
© LayerX Inc. 37 AI-OCR における LLM 活用の課題 AI-OCR における LLM 活用の今後 ・精度が向上する(可能性を持つ)アプローチが限られている ・誤りの修正が困難、どこからその値を抽出したかや座標位置などでの特定出来ない ・「帳票内に存在しない値を出力」や「出力スキーマに従っていない」をゼロに出来ない ※ アノテーションタスク実行時は、リトライを行い補正を試みる実装を行っている ・LLM モデルプロバイダーによる API レートリミットの制限を受ける ・レイテンシ
Slide 38
Slide 38 text
© LayerX Inc. 38 AI-OCR における LLM 活用の展望 AI-OCR における LLM 活用の今後 LLM が得意なユースケースを捉える ■ 日本語以外の帳票での活用 英語以外の外国語帳票のアノテーションは、第一言語にない人では抽出後の意味付けが 難しい、暗黙的な慣習も不明 (汎用的な言語モデルが活かせる) ■ アノテーションタスクの精度向上のために Fine-tuning させたモデルを利用
Slide 39
Slide 39 text
© LayerX Inc. 39 AI-OCR における LLM 活用の展望 AI-OCR における LLM 活用の今後 UX を含めた LLM の活用 ■ 人がアノテーションする際の補助 => 人が入力した値を第三者的に検証し、間違いの可能性を指摘させる
Slide 40
Slide 40 text
Info
Slide 41
Slide 41 text
© LayerX Inc. 41 Startup Central SC010 にてお待ちしております! 展示ブース / Startup Central booth
Slide 42
Slide 42 text
ご清聴ありがとうございました LayerX Inc.