Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Classiが取り組んできた 機械学習の試行錯誤
Search
tetsuroito
February 24, 2022
Science
0
790
Classiが取り組んできた 機械学習の試行錯誤
2022/02/24(木)に開催された教育・医療業界の機械学習LTで発表した資料です
tetsuroito
February 24, 2022
Tweet
Share
More Decks by tetsuroito
See All by tetsuroito
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.7k
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
1
590
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
5.5k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
4.6k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
110
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.4k
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
1.8k
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて
tetsuroito
3
3.2k
サブスクリプションミートアップOPトークスライド
tetsuroito
0
4.7k
Other Decks in Science
See All in Science
位相的データ解析とその応用例
brainpadpr
1
720
240510 COGNAC LabChat
kazh
0
160
非同期コミュニケーションの構造 -チャットツールを用いた組織における情報の流れの設計について-
koisono
0
170
事業会社における 機械学習・推薦システム技術の活用事例と必要な能力 / ml-recsys-in-layerx-wantedly-2024
yuya4
3
250
butterfly_effect/butterfly_effect_in-house
florets1
1
110
トラブルがあったコンペに学ぶデータ分析
tereka114
2
1.2k
Snowflake上でRを使う: RStudioセットアップとShinyアプリケーションのデプロイ
ktatsuya
PRO
0
480
Pericarditis Comic
camkdraws
0
1.4k
山形とさくらんぼに関するレクチャー(YG-900)
07jp27
1
230
ultraArmをモニター提供してもらった話
miura55
0
200
解説!データ基盤の進化を後押しする手順とタイミング
shomaekawa
1
360
(論文読み)贈り物の交換による地位の競争と社会構造の変化 - 文化人類学への統計物理学的アプローチ -
__ymgc__
1
130
Featured
See All Featured
Fashionably flexible responsive web design (full day workshop)
malarkey
405
66k
The Power of CSS Pseudo Elements
geoffreycrofte
73
5.4k
Automating Front-end Workflow
addyosmani
1366
200k
Embracing the Ebb and Flow
colly
84
4.5k
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
26
1.5k
Building Your Own Lightsaber
phodgson
103
6.1k
It's Worth the Effort
3n
183
28k
Art, The Web, and Tiny UX
lynnandtonic
298
20k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
111
49k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
6
510
GraphQLの誤解/rethinking-graphql
sonatard
67
10k
Transcript
Copyright © 2021 Classi Corp. All Rights Reserved. 教育・医療業界の機械学習事例LT 2022/02/24(木)
Classi株式会社 開発本部 本部長 兼 データAI部 部長 伊藤徹郎 Classiが取り組んできた 機械学習の試行錯誤
Copyright © 2021 Classi Corp. All Rights Reserved. 自己紹介 •
名前:伊藤 徹郎 (@tetsuroito) • 所属:Classi株式会社 開発本部|データAI部 • 役職:本部長|部長 • 分野:Educational Technology , Learning Analytics • 著書 ◦ データサイエンティスト養成読本ビジネス活用編 ◦ AI・データ分析プロジェクトのすべて ◦ 実践的データ基盤への処方箋 1
Copyright © 2021 Classi Corp. All Rights Reserved. アジェンダ •
会社概要 • 機械学習の実践例 2
Copyright © 2021 Classi Corp. All Rights Reserved. アジェンダ •
会社概要 • 機械学習の実践例 3
Copyright © 2021 Classi Corp. All Rights Reserved. 4 Classiの会社概要
https://speakerdeck.com/classijp/we-are-hiring より
Copyright © 2021 Classi Corp. All Rights Reserved. 5 Classiのミッション・ビジョン・バリュー
https://speakerdeck.com/classijp/we-are-hiring より 子供の無限の可能性を解き放ち、学びの形を進化させる 先生とともに、学びから学ぶ仕組みを創り、 ワクワクする子どもを増やします • Unlearn & Learn • Love Difference • Make Happen ⁃ 既存の知識を外す勇気。「学び方」を学び続けよう。 失敗してもいい。新しい学びに挑戦しよう。 ⁃ 違いを愛そう。チームを超えて協働しよう。 多様性こそClassiの強み。多様な方がわくわくする。 ⁃ 共に作り、共に実現する。大切なのは、信じて、 やり抜くこと。 Value Mission Vision
Copyright © 2021 Classi Corp. All Rights Reserved. 6 Classiのサービス
https://speakerdeck.com/classijp/we-are-hiring より
Copyright © 2021 Classi Corp. All Rights Reserved. 7 サービス導入実績
https://speakerdeck.com/classijp/we-are-hiring より
Copyright © 2021 Classi Corp. All Rights Reserved. ClassiのデータAI部の目指していること
8 EBE(Evidence-Based-Education) → 先生などの教育者 EBL(Evidence-Based-Learning) → 生徒などの学習者 の実現と運用 つまり教育に必要なデータをサービスを通じて還元し、それぞれのステークホ ルダーが活用する状態 EBE,EBLは ここが自律的に サイクルが 回る状態
Copyright © 2021 Classi Corp. All Rights Reserved. アジェンダ •
会社概要 • 機械学習の実践例 9
Copyright © 2021 Classi Corp. All Rights Reserved. • 自然言語処理を用いた自動作問の実証研究
• アダプティブラーニングの提供と理論 • 音声解析と画像解析を用いた検索精度の改善 • AI-手書きOCRの技術検証 • 声かけのタイプ別で利用率を向上させるA/Bテスト • 問い合わせデータを活用したトピックモデル分析 • 数理最適化技術を用いたスケジュール問題最適化 • 問題の解き直し行動の学力向上への効果検証 など Classiがこれまでに取り組んできた機械学習の取り組み 10
Copyright © 2021 Classi Corp. All Rights Reserved. • 自然言語処理を用いた自動作問の実証研究
• アダプティブラーニングの提供と理論 • 音声解析と画像解析を用いた検索精度の改善 • AI-手書きOCRの技術検証 • 声かけのタイプ別で利用率を向上させるA/Bテスト • 問い合わせデータを活用したトピックモデル分析 • 数理最適化技術を用いたスケジュール問題最適化 • 問題の解き直し行動の学力向上への効果検証 など Classiがこれまでに取り組んできた機械学習の取り組み 11
Copyright © 2021 Classi Corp. All Rights Reserved. • 企画立案
: どんなソリューションで誰の何を解決するか • 技術検証 : ソリューションは適切な範囲で提供可能か • PoC(実データ検証) : 実際にコンセプトは受容されるか • サービス検討 : PoCの結果を元にビジネス化検討 • リリース判断 : ビジネスプランに基づき、サービスリリース判断 AI-手書きOCRの技術検証の進め方 12
Copyright © 2021 Classi Corp. All Rights Reserved. • 企画立案
: どんなソリューションで誰の何を解決するか • 技術検証 : ソリューションは適切な範囲で提供可能か • PoC(実データ検証) : 実際にコンセプトは受容されるか • サービス検討 : PoCの結果を元にビジネス化検討 • リリース判断 : ビジネスプランに基づき、サービスリリース判断 AI-手書きOCRの技術検証の進め方 13
Copyright © 2021 Classi Corp. All Rights Reserved. • 課題
• 学校現場では未だに多くの紙が存在している • 紙は便利だが、管理が煩雑になってしまう • なくしてしまうことがある • ソリューション • 紙に書いた内容を電子化して保存すれば良いのではないか • アプローチする観点 • 学習済みモデルか自社で学習モデルを作るか • 技術要件とユースケースが合うかどうか • コストが見合うかどうか AI-手書きOCRの技術検証について 14
Copyright © 2021 Classi Corp. All Rights Reserved. AI-手書きOCRの3step :
1,前処理 15
Copyright © 2021 Classi Corp. All Rights Reserved. AI-手書きOCRの3step :
2,認識 16
Copyright © 2021 Classi Corp. All Rights Reserved. AI-手書きOCRの3step :
3,補正 17
Copyright © 2021 Classi Corp. All Rights Reserved. • 企画立案
: どんなソリューションで誰の何を解決するか • 技術検証 : ソリューションは適切な範囲で提供可能か • PoC(実データ検証) : 実際にコンセプトは受容されるか • サービス検討 : PoCの結果を元にビジネス化検討 • リリース判断 : ビジネスプランに基づき、サービスリリース判断 AI-手書きOCRの技術検証の進め方 18
Copyright © 2021 Classi Corp. All Rights Reserved. オフライン技術検証のフロー
19 Jupyter上で前処理、AI-OCRで解析、その精度を検証するフローを検討
Copyright © 2021 Classi Corp. All Rights Reserved. 精度検証の方法の検討
20 独自の指標を組み合わせて、精度を検証
Copyright © 2021 Classi Corp. All Rights Reserved. 矩形抽出の検証 21
Copyright © 2021 Classi Corp. All Rights Reserved. • AI-手書きOCRにかける前に画像を前処理しないといけない
• 画像の回転角度の補正 • 台形補正 • 画像サイズと座標の補正 • 文章角度の補正 • コントラスト調整と輪郭の抽出 • 撮影時に入り込んだ影の補正 • etc… 前処理方法の検討 22 前処理で精度を担保することが現実的に無理なため、 ユースケースを限定することで精度向上を目指すことに
Copyright © 2021 Classi Corp. All Rights Reserved. • 手書き文字と印刷文字の混在パターンも存在することが判明
• 活字のタイプ別の読み取り精度の検証 • フォントの違いによる精度検証 • 文章の長さによる精度検証 • 罫線を用意した場合とそうでない場合の精度検証 • マス目の場合のフォーマットの精度検証 など、いろいろなパターンを想定して、精度がどう変化するか検証 活字の読み取り検証 23
Copyright © 2021 Classi Corp. All Rights Reserved. • 企画立案
: どんなソリューションで誰の何を解決するか • 技術検証 : ソリューションは適切な範囲で提供可能か • PoC(実データ検証) : 実際にコンセプトは受容されるか • サービス検討 : PoCの結果を元にビジネス化検討 • リリース判断 : ビジネスプランに基づき、サービスリリース判断 AI-手書きOCRの技術検証の進め方 24
Copyright © 2021 Classi Corp. All Rights Reserved. • 実際に複数のお客様に協力いただき、実験を行った
• 精度指標が約70&ほどだったが、その受け入れも含めて • サービス提供フローを構築し、その業務イメージが現場にFitするかどう か • PoC 25
Copyright © 2021 Classi Corp. All Rights Reserved. • 企画立案
: どんなソリューションで誰の何を解決するか • 技術検証 : ソリューションは適切な範囲で提供可能か • PoC(実データ検証) : 実際にコンセプトは受容されるか • サービス検討 : PoCの結果を元にビジネス化検討 • リリース判断 : ビジネスプランに基づき、サービスリリース判断 AI-手書きOCRの技術検証の進め方 26
Copyright © 2021 Classi Corp. All Rights Reserved. • 今回のPoCでは、運用コストが非常に大きい点
• ユースケースを限定したために活用イメージができなかった点 • 精度自体もケースに応じて不安定な点 • ビジネスモデルをうまく構築できない点 など、いろいろな要因を鑑みて、サービスリリースを見送りました そのため、供養のLTを披露させていただきました! サービス化検討&リリース判断 27
Copyright © 2021 Classi Corp. All Rights Reserved. 宣伝:Classiでは教育業界に機械学習のソリューションを適用したいエンジニアを募集しています
28 https://hrmos.co/pages/classi/jobs?category=1378626424374710272&_ga=2.195036393.490006783.1645439063-165287458.1525770617
Copyright © 2021 Classi Corp. All Rights Reserved. おわり 29
ご静聴 ありがとうございました! 🙏🙏🙏