Upgrade to Pro — share decks privately, control downloads, hide ads and more …

「機械学習」という技術で価値を創出する技術 / techniques-to-create-values-with-ml-layerx

「機械学習」という技術で価値を創出する技術 / techniques-to-create-values-with-ml-layerx

2022年10月15日、技育祭2022秋における講演資料です。

様々なコンテンツやクラウドサービスの充実により、機械学習という技術を利用するハードルは低くなりました。一方で、機械学習を用いて価値を生み出すことは容易ではありません。本勉強会では、プロダクト開発において「機械学習」という技術で価値を創出する技術について、バクラク請求書の実例とともにお話ししました。

https://talent.supporterz.jp/events/725b64f3-2791-4c99-84cf-6a2dbcfe909d/

Yuya Matsumura

October 15, 2022
Tweet

More Decks by Yuya Matsumura

Other Decks in Technology

Transcript

  1. 「機械学習」という技術で価値を創出す 技術 事業会社において価値あ プロダクトを作 15.Oct.2022 技育祭【秋】2022 - Yuya Matsumura(@yu-ya4)

  2. 自己紹介

  3. Confidential © 2022 LayerX Inc. 4 画像を入れてね 自己紹介 松村 優也(Yuya

    Matsumura) - 株式会社LayerX 機械学習エンジニア - ウォンテッドリー株式会社 技術顧問 - 静岡大学・兵庫県立大学 非常勤講師 共著 『推薦システム実践入門』 趣味 お酒・インターネット地獄巡 ・音楽 @yu___ya4 @yu-ya4
  4. © 2022 LayerX Inc. 5 略歴 2018年3月 京都大学大学院 情報学研究科 社会情報学専攻

    修了 / 情報検索・情報推薦の研究 2018年4月 4回生の時にインターン先のスタートアップか 出資を受け起業 プログラミング教育・受託開発・人材系など 2019年まで代表として経営 新卒で Wantedly に1人目のデータサイエンティストとして入社 推薦システムチームの立ち上げ 2019年9月 同チームのリーダーとな 、機械学習活用・推薦システムの開発に 一層力を入 2021年3月 開発チームのマネージャーに就任 Wantedly Visit の PdM と 組織全体の EM も兼任す ことに 2021年11月 静岡大学 非常勤講師(年に一度、推薦システムの講演) 2016年3月 京都大学 工学部 情報学科 卒業 元々塾講師にな つも で3回生までバイトかサークルの日々 → 一念発起してエンジニアの道へ 2022年5月 兵庫県立大学 非常勤講師(年に一度、推薦システムの講演) / 『推薦システム実践入門』出版 2022年9月 LayerXに機械学習エンジニアとして入社 / Wantedly 技術顧問就任
  5. LayerXのご紹介

  6. © 2022 LayerX Inc. 7 ミッション

  7. © 2022 LayerX Inc. 8 賭け マーケット

  8. © 2022 LayerX Inc. 9 アプローチ

  9. © 2022 LayerX Inc. 10 3つの事業

  10. バクラクシリーズについて

  11. © 2022 LayerX Inc. 12 事業ビジョン 圧倒的に使いやすいプロダクトで わくわくす 働き方を。 企業活動を支え

    コーポレート業務は、ミスができない難しい業務。 バクラクはそんな業務の負担を少しでも軽くし、日常の業務がわくわくす うな体験を届けます。 使いやすさへの圧倒的なこだわ と、深い顧客理解で業務効率化を実現。 手作業、ハンコ、紙のや 取 か 脱却し、事業と組織を支え 本来の仕事に向き合え うサポートします。
  12. © 2022 LayerX Inc. 13 法人支出管理(BSM)SaaS「バクラク」を展開 * 経費精算のSlack連携は申請内容の通知のみ 稟議・支払申請・経費精算・ワークフロー ・AIが領収書を5秒でデータ化

    ・承認はチャットアプリか ・シームレスな内部統制構築 仕訳・支払処理効率化 ・AIが請求書を5秒でデータ化 ・仕訳データを自動学習、 手入力ゼロへ ・改正電子帳簿保存法に対応 ・利用料無料 ・即時追加発行 ・最大1億円決済可能 法人向けクレジットカード ・無料で始め ・手入力ゼロで証憑管理 ・改正電子帳簿保存法に対応 帳票保存・ストレージ バクラクでは機械学習がコア技術としてフル活用さ ています!
  13. © 2022 LayerX Inc. 14 バクラクの提供サービス群

  14. © 2022 LayerX Inc. 15 バクラクがつく 未来

  15. 本日の勉強会のテーマ

  16. © 2022 LayerX Inc. 17 「機械学習」という技術で価値を創出す 技術

  17. © 2022 LayerX Inc. 18 「価値を創出す 」とは? 今回は「ユーザーの課題を解決でき、ビジネスとして成立す プロダクト作 こと」と定義

    そのためには以下の うな要素が必要 ※研究開発であった 、単に面白いものを作 、というのも大変重要で価値のあ ことです。その うな活動の先に、現在私たちが当た 前に使 うことのでき 技術があ ます。今回はあくまで「事業会社におけ プロダクト作 」にフォーカスしてい ということをご理解ください。 解決すべき課題を 見極め 技術的に解決す ことが でき のか見極め 実際にユーザーに使わ プロダクトを作 • 本当にユーザーは困ってい ? • 収益化でき ? • (機械学習)技術で解決でき のか? • 真にユーザーの課題が解決さ ソ リューションとなってい か? • 使いやすいUXとなってい か? • 正しく(機械学習)技術を活用でき か?
  18. © 2022 LayerX Inc. 19 「価値を創出す 」とは? 「ユーザーの課題を解決できてビジネスとして成立す プロダクト作 こと」と定義

    今回はこの中か 3つの要素に注目してお話しします。 ※研究開発であった 、単に面白いものを作 、というのも大変重要で価値のあ ことです。その うな活動の先に、現在私たちが当た 前に使 うことのでき 技術があ ます。今回はあくまで「事業会社におけ プロダクト作 」にフォーカスしてい ということをご理解ください。 解決すべき課題を 見極め 技術的に解決す ことが でき のか見極め 実際にユーザーに使わ プロダクトを作 • 本当にユーザーは困ってい ? • 収益化でき ? • (機械学習)技術で解決でき のか? • 真にユーザーの課題が解決さ ソ リューションとなってい か? • 使いやすいUXとなってい か? • 正しく(機械学習)技術を活用でき か?
  19. © 2022 LayerX Inc. 20 「価値を創出す 」とは? 「ユーザーの課題を解決できてビジネスとして成立す プロダクト作 こと」と定義

    「解決すべき課題を見極め 」のもめちゃくちゃ重要な要素ですが、今回は省略 気にな 方は「プロダクトマネジメント」について勉強してみてください! ※研究開発であった 、単に面白いものを作 、というのも大変重要で価値のあ ことです。その うな活動の先に、現在私たちが当た 前に使 うことのでき 技術があ ます。今回はあくまで「事業会社におけ プロダクト作 」にフォーカスしてい ということをご理解ください。 解決すべき課題を 見極め 技術的に解決す ことが でき のか見極め 実際にユーザーに使わ プロダクトを作 • 本当にユーザーは困ってい ? • 収益化でき ? • (機械学習)技術で解決でき のか? • 真にユーザーの課題が解決さ ソ リューションとなってい か? • 使いやすいUXとなってい か? • 正しく(機械学習)技術を活用でき か?
  20. © 2022 LayerX Inc. 21 「価値を創出す 」とは? 「ユーザーの課題を解決できてビジネスとして成立す プロダクト作 こと」と定義

    今回の勉強会では、請求書受け取 業務の非効率を解消す ことで、時間(将来的にはお金も)の使い方の節約 を目指す、バクラク請求書の「請求書読み取 機能」を例に説明していきます。 ※研究開発であった 、単に面白いものを作 、というのも大変重要で価値のあ ことです。その うな活動の先に、現在私たちが当た 前に使 うことのでき 技術があ ます。今回はあくまで「事業会社におけ プロダクト作 」にフォーカスしてい ということをご理解ください。 解決すべき課題を 見極め 技術的に解決す ことが でき のか見極め 実際にユーザーに使わ プロダクトを作 • 本当にユーザーは困ってい ? • 収益化でき ? • (機械学習)技術で解決でき のか? • 真にユーザーの課題が解決さ ソ リューションとなってい か? • 使いやすいUXとなってい か? • 正しく(機械学習)技術を活用でき か? 仕訳・支払処理効率化 ・AIが請求書を5秒でデータ化 ・仕訳データを自動学習、 手入力ゼロへ ・改正電子帳簿保存法に対応
  21. © 2022 LayerX Inc. 22 バクラク請求書 請求書読み取 (OCR)機能のデモ

  22. 機械学習で解決でき のか

  23. © 2022 LayerX Inc. 24 機械学習で解決でき 課題 以下の3つのポイントを満たす場合、機械学習で課題を解決でき ・解決すべき可能性が高い (正解データのあ

    ) 大量のデータが得 扱うデータが 十分に複雑であ データの特性が 変化し続け
  24. © 2022 LayerX Inc. 25 機械学習で解決でき 課題 (正解データのあ ) 大量のデータが得

    扱うデータが 十分に複雑であ データの特性が 変化し続け 以下の3つのポイントを満たす場合、機械学習で課題を解決でき ・解決すべき可能性が高い
  25. © 2022 LayerX Inc. 26 (正解データのあ )大量のデータが得 機械学習は、大量のデータか 自動でルールを学習す データが十分にないとルールを学習できなかった

    (未学習)、学習データのみに適合してしまう(過学習) • 今あ のか?今はなくともこ か たま 仕組みがあ のか? • データは使え 程度にはキレイか、開発に際してアクセス可能な状態か? • 教師あ 学習を行う場合は、正解データも十分に得 か? ◦ アノテーションを行う必要があ な 、その仕組みや体制は整ってい か?
  26. © 2022 LayerX Inc. 27 (正解データのあ )大量のデータが得 機械学習は、大量のデータか 自動でルールを学習す データが十分にないとルールを学習できなかった

    (未学習)、学習データのみに適合してしまう(過学習) • 今あ のか?今はなくともこ か たま 仕組みがあ のか? → 今もあ し(月次数百億円規模の請求書)、こ か も増えていくであ う。 • データは使え 程度にはキレイか、開発に際してアクセス可能な状態か?  →整備さ てお 、適切な情報・権限管理のもと一部の開発者はアクセス可能 • 教師あ 学習を行う場合は、正解データも十分に得 か? → サービスが利用さ と正解データであ ユーザーの入力値がたまっていく。 ◦ アノテーションを行う必要があ な 、その仕組みや体制は整ってい か?      → 別途アノテーション用の基盤システムや、組織が整備さ てい 。 https://note.com/fukkyy/n/nf00ddb836a03 の場合
  27. © 2022 LayerX Inc. 28 機械学習で解決でき 課題 (正解データのあ ) 大量のデータが得

    扱うデータが 十分に複雑であ データの特性が 変化し続け 以下の3つのポイントを満たす場合、機械学習で課題を解決でき ・解決すべき可能性が高い
  28. © 2022 LayerX Inc. 29 扱うデータが十分に複雑であ 機械学習は、複雑で人間が記述す ことが難しいルールを見つけ出すのが得意 単純なデータであ ば、人手でルールを記述す

    (一般的なプログラミング)ので十分なことも。 • ルールが複雑(難解・大量)で人手で記述す ことが困難か? ◦ Fizz Buzz に機械学習を用い こともでき が、そのコストを事業上許容でき かというと... • データの扱いが難しいか? ◦ めちゃくちゃたくさんのカラムがあ 表データ ◦ 自然言語や画像、音声などの非構造化データ
  29. © 2022 LayerX Inc. 30 扱うデータが十分に複雑であ 機械学習は、複雑で人間が記述す ことが難しいルールを見つけ出すのが得意 単純なデータであ ば、人手でルールを記述す

    (一般的なプログラミング)ので十分なことも。 • ルールが複雑(難解・大量)で人手で記述す ことが困難か? → 世の中には様々な請求書のパターンが存在してお 、かつ、ユーザーの運用もそ ぞ で複雑であ 。 • データの扱いが難しいか? → 非構造化データであ 画像ファイルやPDF形式の請求書を扱う必要があ 。 の場合
  30. © 2022 LayerX Inc. 31 機械学習で解決でき 課題 (正解データのあ ) 大量のデータが得

    扱うデータが 十分に複雑であ データの特性が 変化し続け 以下の3つのポイントを満たす場合、機械学習で課題を解決でき ・解決すべき可能性が高い
  31. © 2022 LayerX Inc. 32 データの特性が変化し続け 機械学習は、データの特性が変わっても再学習す ことで自動で新しいルールを更新でき 変化し続け ルールを人手で更新し続け

    のは困難。変化しないな 気合いですべて記述してしまう手も? • ユーザーの性質は変化す か? ◦ プロダクト規模の拡大に 、異な セグメントのユーザーが利用す うになった ◦ 同一ユーザーでも時間の流 とともに嗜好が変わった • 世の中の状況の変化にプロダクトは影響を受け か? ◦ 法改正・流行の変化・景気・パンデミック...
  32. © 2022 LayerX Inc. 33 データの特性が変化し続け 機械学習は、データの特性が変わっても再学習す ことで自動で新しいルールを更新でき 変化し続け ルールを人手で更新し続け

    のは困難。変化しないな 気合いですべて記述してしまう手も? • ユーザーの性質は変化す か?  → どんどんい んな規模や業界の企業さまにご利用いただいていってい 。企業さまに 、利用してい 請 求書のフォーマットは様々であ 。 • 世の中の状況の変化にプロダクトは影響を受け か? → 「インボイス制度」に 、読み取 ことのでき べき請求書の項目が増加。 → コロナ禍に 在宅勤務が進んだ影響などで、副業を行う個人事業主が増加。 の場合
  33. © 2022 LayerX Inc. 34 機械学習で解決でき 課題 適切に状況を見極め、手段(≠目的)であ 機械学習を適用す べきか考え

    ことが重要 (正解データのあ ) 大量のデータが得 扱うデータが 十分に複雑であ データの特性が 変化し続け
  34. 真にユーザーの課題が解決さ か

  35. © 2022 LayerX Inc. 36 真にユーザーの課題が解決さ ソリューションか どうす ばプロダクトが真にユーザーの課題が解決でき うな価値を提供でき

    か 以下の2つの観点で考えてみ 何を入出力とす か 何を性能指標とす か
  36. © 2022 LayerX Inc. 37 真にユーザーの課題が解決さ ソリューションか 何を入出力とす か 何を性能指標とす

    か どうす ばプロダクトが真にユーザーの課題が解決でき うな価値を提供でき か 以下の2つの観点で考えてみ
  37. © 2022 LayerX Inc. 38 何を入出力とす か 「請求書の読み取 機能」と聞くと、どの うな入出力を想像しますか?

    請求書ファイル (画像・PDF) 支払期日 支払金額 2021/04/30 取引先 11,000 株式会社テンプレ 請求書に記載の 項目ごとの値 多分こんな感じ...
  38. © 2022 LayerX Inc. 39 何を入出力とす か 「請求書の読み取 機能」と聞くと、どの うな入出力を想像しますか?

    こ はこ で正しいのだが、ユーザーが本当に求めてい ものは何なのか考えてみ ことが重要 請求書ファイル (画像・PDF) 支払期日 支払金額 2021/04/30 取引先 11,000 株式会社テンプレ 請求書に記載の 項目ごとの値
  39. © 2022 LayerX Inc. 40 顧客(ユーザー)が本当に求めてい 出力 ケース1 支払期日として2021年2月28日(日)を検出 顧客「実際に支払うのは平日の26日(金)だか

    変更しないと!」 ケース2 支払金額として500,000円を検出 顧客「実際に支払うのは源泉税10.21%を差し引いた448,950円だか 変更しないと!」 ユーザーが本当に欲しいのは「請求書に記載の値」ではなく「実際の運用に即した値」
  40. © 2022 LayerX Inc. 41 何を入出力とす か 顧客(ユーザー)が本当に求めていた「請求書読み取 機能」の入出力 請求書ファイル

    (画像・PDF) 支払期日 支払金額 2021/02/28 取引先 500,000 株式会社テンプレ 請求書に記載の 項目ごとの値 支払期日 支払金額 2021/02/26 取引先 448,950 株式会社テンプレ 請求書に記載の 項目ごとの値に基づいた 実際の運用に即した値 • 「請求書に記載の値」を正確に読み取 だけでもユーザーは十分嬉しいが、そ だけでは真の課題解決にな ない。 • 「実際の運用に即した値」を出力できて初めて真の課題解決、大きな価値を提供できたこととな 。
  41. © 2022 LayerX Inc. 42 「顧客が本当に必要だったもの」を明 かにす 方法 例のアレ 顧客へのヒアリングや、実際に顧客に製品(プロトタイプ)を使っても

    う、データ分析、等々... • 詳しく学びたい人はプロダクトマネジメントを学んでみ う!めちゃくちゃ難しいです。 • LayerX ではめちゃくちゃ顧客にヒアリングをした 、社内にドメインエキスパートがいた します。 https://dic.nicovideo.jp/a/%E9%A1%A7%E5%AE%A2%E3%81%8C%E6%9C%AC%E5%BD%93%E3% 81%AB%E5%BF%85%E8%A6%81%E3%81%A0%E3%81%A3%E3%81%9F%E3%82%82%E3%81%AE
  42. © 2022 LayerX Inc. 43 真にユーザーの課題が解決さ ソリューションか 何を入出力とす か 何を性能指標とす

    か どうす ばプロダクトが真にユーザーの課題が解決でき うな価値を提供でき か 以下の2つの観点で考えてみ
  43. © 2022 LayerX Inc. 44 何を性能指標とす か 請求書ファイル (画像・PDF) 支払期日

    支払金額 2021/02/26 取引先 448,950 株式会社テンプレ 請求書に記載の 項目ごとの値に基づいた 実際の運用に即した値 この「請求書読み取 機能」が「真にユーザーの課題を解決してい 」とはどういう状態? • 1,000件の請求書が入力さ て、すべてに対して「実際の運用に即した値」=「正解」を出力できていた 完璧 ◦ だが、もち ん実際はそうもいかない • では、1,000件の請求書が入力さ て、910件が正解を出力できてい 状態は? ◦ 91%正解できてい のでけっこう良さそう!本当に...?
  44. © 2022 LayerX Inc. 45 全体の正解率だけでは見えないものがあ 1,000件の請求書が入力さ て、910件が正解を出力、正解率91%!でも... • たとえば10人のユーザーが利用してく

    てい とす 。 • 実は1人のユーザーが910件の請求書を入力していて、残 の9人はそ ぞ 10件ずつ入力していたとす 。 • 実は正解してい 910件はすべて1人のユーザーが入力したものだとす 。 • その場合、1人のヘビーユーザーは正解率100%で大変満足してい が、残 の9人は正解率0%とな 。 • 10人のユーザーが利用してく てい のに、1人(10%)のユーザーにしかプロダクトの価値が提供できていな いこの状態は決して「真にユーザーの課題を解決してい 」とは言えないはず。 😃 😃 😃 😃 😃 😃 😃 😃 😃 😃 😃 😃 😃 😃 😃 😃 😃 😃 😃 😃 😆 😓 😓 😓 😓 😓 😓 😓 😓 😓
  45. © 2022 LayerX Inc. 46 全体だけではなく個別の事象を性能指標に反映す 以下の例では同じ1,000件の請求書が入力さ て、910件が正解を出力、正解率91%!でも... • 1人のヘビーユーザーが正解率100%で、残

    の9人は正解率0%の場合 ◦ ユーザーごとの正解率の平均は(100 + 0 * 9) / 10 = 10% • 1人のヘビーユーザーは正解率約95%(865/910)で、残 の9人は正解率50%(5/10)の場合 ◦ ユーザーごとの正解率の平均は(95 + 50 * 9) / 10 = 54.5% 常にユーザーへの提供価値か 逆算して何を性能指標とす べきか考え 全体の正解率(91%)は同じでも、ユーザーごとの正解率の平均には大きな差が生ま た。 今回のケースの場合、おそ く後者のほうがプロダクトを利用す ユーザーの課題が解決さ てい 状態と言え ため、全体 の正解率(だけ) かは、ユーザーごとの正解率の平均を性能指標として使うことは筋が良さそう。 (こ はこ で、入力の少ないユーザーの重みが大き過ぎ という問題があ かもし ないが...) 正直なとこ 正解はない... 難しい...でもだか こそ面白い!
  46. © 2022 LayerX Inc. 47 さ にユーザーへの提供価値を考えてみ バクラクが解決したい課題を思い返すと、請求書読み取 が目指すとこ は

    “Saving Time” たとえば、「ユーザーが請求書処理において1枚当た にかけた時間」を性能指標にす ことが考え 。 • システムが正解を出力でき ば最短で請求書の処理が終わ ので性能指標が改善さ 。 • システムが入力の請求書を受け取ってか 出力を返すまでの時間が短くな ば性能指標が改善さ 。 • 正解を出力できなくとも、ユーザーができ だけ早く間違いを訂正でき うな仕組みを提供でき ば性能指 標の悪化を最低限に抑え 。 ど だけたくさんの正解を出力でき か、以外の要素も真の課題解決・ユーザーへの提供価値最大化には重要
  47. © 2022 LayerX Inc. 48 真にユーザーの課題が解決さ ソリューションか ユーザーの課題が解決さ か・ユーザーへの提供価値か 逆算してシステムの入出力や性能指

    標を考え ことが重要 何を入出力とす か 何を性能指標とす か
  48. 正しく機械学習を活用でき か

  49. © 2022 LayerX Inc. 50 正しく機械学習を活用でき か 「請求書ファイル」を入力、「実際の運用に即した値」を出力と定義、正解データを集めて機械学習? そ でも悪くないが、

    end-to-end な機械学習(深層学習)が常にベストな選択とは限 ない • 技術的な難易度や、単純に問題としての難易度が向上す 。 • 一般的に必要なデータ量が( )膨大にな 。必要なマシンリソースや学習にかか 時間なども大きくな 。 • ま ま ブラックボックスにな ため、予測性能が落ちた際などに問題の切 分けが難しい。 請求書ファイル (画像・PDF) 支払期日 支払金額 2021/02/26 取引先 448,950 株式会社テンプレ 請求書に記載の 項目ごとの値に基づいた 実際の運用に即した値
  50. © 2022 LayerX Inc. 51 問題を分割してみ 入力か 出力までを意味のあ 単位で分割し多段の処理で表現、 うまく機械学習で解けない

    か、あ いは機械学習という手段を取 ない方が良い処理がないか検討してみ 。 請求書ファイル (画像・PDF) 支払期日 支払金額 500,000 請求書に記載の 項目ごとの値 実際の運用に即した値 { “bbox”: [{"x": 0.3421, "y": 0.567},...], "word": “2021/2/28” },... 2021/02/28 株式会社テンプレ 取引先 支払期日 支払金額 448,950 2021/02/26 株式会社テンプレ 取引先 請求書内の 文字と座標 たとえば、 • 「請求書に記載の値」を「実際の運用に即した値」に変換す 処理を加え ことで、そ ぞ を分割 • 請求書ファイルか 文字検出と文字認識を行う処理と、そ ぞ の文字がどの項目に該当す か推定す 処理 を加え ことで、「請求書内の文字と座標」という中間出力を追加 項目推定 なん かの 変換処理 文字検出 文字認識
  51. © 2022 LayerX Inc. 52 自前で機械学習モデルを作成す 以外の手段の検討 請求書ファイル (画像・PDF) 支払期日

    支払金額 500,000 請求書に記載の 項目ごとの値 実際の運用に即した値 { “bbox”: [{"x": 0.3421, "y": 0.567},...], "word": “2021/2/28” },... 2021/02/28 株式会社テンプレ 取引先 支払期日 支払金額 448,950 2021/02/26 株式会社テンプレ 取引先 請求書内の 文字と座標 たとえば、 • 「請求書に記載の値」を「実際の運用に即した値」に変換す 処理は、あ 程度まではルールベースで十分かも。 ◦ e.g. 抽出さ た支払期日か土日な ば、そ 以前の最後の平日の日時に変換す • 文字検出・文字認識は自前で実装せずにクラウドサービスを利用したほうが手間が少なく、精度も高いかも。 文字検出 文字認識 項目推定 なん かの 変換処理 Vision API などのク ラウドサービスを利 用 ルールベースで後 処理
  52. © 2022 LayerX Inc. 53 本当に必要な処理のみ自前で機械学習モデルを作成す 請求書ファイル (画像・PDF) 支払期日 支払金額

    500,000 請求書に記載の 項目ごとの値 実際の運用に即した値 { “bbox”: [{"x": 0.3421, "y": 0.567},...], "word": “2021/2/28” },... 2021/02/28 株式会社テンプレ 取引先 支払期日 支払金額 448,950 2021/02/26 株式会社テンプレ 取引先 請求書内の 文字と座標 請求書内の文字と座標がそ ぞ どの項目に該当す か推定す 、という処理に対して自前で機械学習モデルを作成 • end-to-end な機械学習に比べて技術的な難易度や問題としての難易度が低減 • 必要なデータ量、マシンリソースや学習にかか 時間などのコストが削減 • 予測性能が落ち など問題が生じた際、どこの処理で問題が起きてい のかの原因に切 分けが行いやすい 文字検出 文字認識 項目推定 なん かの 変換処理 Vision API などのク ラウドサービスを利 用 ルールベースで後 処理 自前で機械学習モ デルを作成
  53. © 2022 LayerX Inc. 54 正しく機械学習を活用でき か 問題を分解した上で、解決す 難易度や精度、コストのバランスを鑑みた上で適切な処理に機械 学習を適用す

    ことが重要 請求書ファイル (画像・PDF) 支払期日 支払金額 500,000 請求書に記載の 項目ごとの値 実際の運用に即した値 { “bbox”: [{"x": 0.3421, "y": 0.567},...], "word": “2021/2/28” },... 2021/02/28 株式会社テンプレ 取引先 支払期日 支払金額 448,950 2021/02/26 株式会社テンプレ 取引先 請求書内の 文字と座標 文字検出 文字認識 項目推定 なん かの 変換処理 Vision API などのク ラウドサービスを利 用 ルールベースで後 処理 自前で機械学習モ デルを作成
  54. まとめ

  55. © 2022 LayerX Inc. 56 まとめ - 「機械学習」という技術で価値を創出す 技術 •

    機械学習で解決でき のか ◦ 適切に状況を見極め、手段(≠目的)であ 機械学習を適用す べきか考え ことが重要 • 真にユーザーの課題が解決さ か ◦ ユーザーの課題が解決さ か・ユーザーへの提供価値か 逆算してシステムの入出力や性能指 標を考え ことが重要 • 正しく機械学習を活用でき か ◦ 問題を分解した上で、解決す 難易度や精度、コストのバランスを鑑みた上で適切な処理に機械 学習を適用す ことが重要
  56. © 2022 LayerX Inc. 57 まとめ - 「機械学習」という技術で価値を創出す 技術 •

    機械学習で解決でき のか ◦ 適切に状況を見極め、手段(≠目的)であ 機械学習を適用す べきか考え ことが重要 • 真にユーザーの課題が解決さ か ◦ ユーザーの課題が解決さ か・ユーザーへの提供価値か 逆算してシステムの入出力や性能指 標を考え ことが重要 • 正しく機械学習を活用でき か ◦ 問題を分解した上で、解決す 難易度や精度、コストのバランスを鑑みた上で適切な処理に機械 学習を適用す ことが重要 い い と説明・事例を紹介しましたが、プロダクトの性質や状況に って進め方は様々なので、 原則に基づいて自分の頭でしっか 考え ことが重要