当てられるようになってきた • 機械学習モデルは”劣化”する ü 時代・環境の変化によりデータが変化していき、モデルが追従できなくなる ü データ・モデルの変化を監視し、モデル再学習・再開発などの継続的改善・ 運⽤していく仕組み・⽅法論が必要 ビッグデータ・AIによる継続的な価値創造をしていくことにつながる
正解データ収集のためのアンケート実施 • 既存カテゴリの継続的改善 ü 正解データ更新によるデータ更新・精度向上 ü 精度改善⽅策の⼀つとして、プロダクトの⽴ち位置の再整理も⾏う場合がある ü 広報活動 ü 既存カテゴリの利⽤拡⼤ ü 新規カテゴリの潜在的な需要掘り起こし プロダクトの継続的改善のための戦略⽅針策定・広報活動の実施 PM (AI) PM (Biz)
Service C Service A Service B Service C Service A Service B Service C … Embedding layer Simple DNN ResNet (CNN) … MLP-mixer (SoTA) … Splitted by service Service dropout AI Eng. (Library) AI Eng. (Model)
truth Create Dataset Dataset Train model Model Task Infra Eng. Hadoop Cluster (IU) Kubernetes Cluster • Data preprocessing (ETL) • Data postprocessing • Save output data • Preprocess • Distributed ML (Train/Predict) • Postprocess Scheduled by Workflow Engine Controlled by CI/CD tools ⼤規模データ分析・機械学習基盤のもと、継続的運⽤の仕組みが整備
data A Ground truth A Create Dataset A Dataset A Train model A Model A Preprocess B Preprocessed data B Ground truth B Create Dataset B Dataset B Train model B Model B Preprocess C Preprocessed data C Ground truth C Create Dataset C Dataset C Train model C Model C Task B Task A Task C
Dataset A Dataset A Train model A Model A Preprocess Preprocessed data B Ground truth B Create Dataset B Dataset B Train model B Model B Ground truth C Create Dataset C Dataset C Train model C Model C Task B Task A Task C Create Dataset API ghee- models API Utils Felib: Library for Feature Engineering … 共通ライブラリ・パイプラインにより、モデル開発・デプロイ効率向上 Infra Eng. AI Eng. (Library) AI Eng. (Model)
ü データサイエンス・AIをコアとするプロダクトを開発・運⽤していくにあたっ て、これらの知⾒を持っているのは価値になる ü データサイエンティスト・AIエンジニア以外でその知⾒を活かすというキャリ アも踏まえて⼈材育成していくことが⼤事 ü 個⼈的には、データサイエンス・AIは道具であり、データサイエンス・AIが浸 透した世界ではそれが⾃然だしそう向かうべきだと考えている