AWS Japan 入社。 ソリューションアーキテクトとして日本の スタートアップに対する AWS 導入支援を行っており、 特に機械学習基盤の設計・構築や、 開発体制の整備にまつわる相談を手掛ける。 趣味はドラム。好きなドラマーは Dave Weckl, Chad Smith (Red Hot Chili Peppers) など。
All rights reserved | AWS ML stack 最も広範かつ充実した機械学習のサービス群 VISION SPEECH TEXT SEARCH CHATBOTS PERSONALIZATION FORECASTING FRAUD DEVELOPMENT CONTACT CENTERS Ground Truth AWS Marketplace for ML Neo Augmented AI Built-in algorithms Notebooks Experiments Processing Model training & tuning Debugger Autopilot Model hosting Model Monitor Deep Learning AMIs & Containers GPUs & CPUs Elastic Inference Inferentia FPGA Amazon Rekognition Amazon Polly Amazon Transcribe +Medical Amazon Comprehend +Medical Amazon Translate Amazon Lex Amazon Personalize Amazon Forecast Amazon Fraud Detector Amazon CodeGuru AI SERVICES ML SERVICES ML FRAMEWORKS & INFRASTRUCTURE Amazon Textract Amazon Kendra Contact Lens For Amazon Connect SageMaker Studio IDE Amazon SageMaker DeepGraphLibrary Deep Java Library
All rights reserved | SOLUTION ARCHITECTURE Next Gen Stats ソリューション全体を AWS で実行 Amazon SageMaker では、MLモデルを 既存の分析パイプラインにデプロイで きます ストリーミングデータアーキテクチャ 150ms Apache Kafka Real-time data Data distributors Stadium Stats FTP Tracking data Traditional stats NGS processors Amazon SageMaker ML processors NGS Datastore Websites NGS API Club tools 1000ms
All rights reserved | 「Cinnamon AI は、Amazon SageMaker マネージドスポットトレーニングで ML モデルのトレーニングコストを 70% 節約」 https://aws.amazon.com/jp/blogs/news/cinnamon-ai-saves-70-on-ml-model- training-costs-with-amazon-sagemaker-managed-spot-training/
All rights reserved | 「効率的にインテル® FPGA エッジデバイス上の深層学習推論を実行する」 https://aws.amazon.com/jp/blogs/startup/using-fewer-resources-to-run-deep-learning- inference-on-intel-fpga-edge-devices/ AWS Cloud AWS IoT Greengrass Certified DE10-Nano Amazon SageMaker Amazon SageMaker Ground Truth Optimized Model AWS IoT Core Amazon Kinesis Data Firehose Camera AWS IoT Greengrass Image Inference Results LeapMind Deep Learning Accelerator IP Cyclone® V SoC FPGA Training Data Amazon ECR Blueoil Docker Image Label Lambda function Training Output
All rights reserved | “Making Amazon SageMaker and TensorFlow Work for You — Mobileye guest post” https://medium.com/@julsimon/making-amazon-sagemaker-and-tensorflow- work-for-you-893365184233
All rights reserved | Amazon SageMaker Autopilot 完全な可視性と制御を伴う モデルの自動作成 クイックスタート データを表形式で提供し、対象予測を指定 モデルの自動作成 フィーチャエンジニアリングでMLモデルを取得すると モデルのチューニングが自動的に完了 Visibility and control ソースコードでモデル用のノートブックを入手 推奨事項と最適化 リーダーボードを入手し、モデルの改善を継続
All rights reserved | トレーニングデータの収集と準備 トレーニングデータの収集と準備 フルマネージド型のデータ処理ジョブ/ データラベル付けのワークフロー Choose or bring your own ML algorithm Collaborative notebooks, built-in algorithms/models Set up and manage environments for training One-click training Train, debug, and tune models Debugging and optimization Manage training runs Visually track and compare experiments Deploy model in production One-click deployment and autoscaling Monitor models Automatically spot concept drift Validate predictions Add human review of predictions Scale and manage the production environment Fully managed with auto-scaling for 75% less ML用ウェブベースのIDE モデルの自動構築とトレーニング
All rights reserved | Amazon SageMaker Ground Truth 機械学習を使用して高精度な トレーニングデータセットを 構築 データラベル付けのコストを削減 最大 70% アノテータにアクセス Amazon Mechanical Turk (クラウドソーシング)、 アマゾン認定ベンダー、または自社のアノテータ 正確な結果を迅速に実現 ビルトインのデータラベル付けワークフロー 3D ポイントクラウド、ビデオ、画像、テキストをサポート
All rights reserved | アルゴリズムの選択または構築 Collect and prepare training data Fully managed data processing jobs/ data labeling workflows Set up and manage environments for training One-click training Train, debug, and tune models Debugging and optimization Manage training runs Visually track and compare experiments Deploy model in production One-click deployment and autoscaling Monitor models Automatically spot concept drift Validate predictions Add human review of predictions Scale and manage the production environment Fully managed with auto-scaling for 75% less ML用ウェブベースのIDE モデルの自動構築とトレーニング 独自のMLアルゴリズム を選択または持参 コラボレーティブ・ノートブック ビルトインアルゴリズム/モデル
All rights reserved | モデルのトレーニングとチューニング Collect and prepare training data Fully managed data processing jobs/ data labeling workflows Deploy model in production One-click deployment and autoscaling Monitor models Automatically spot concept drift Validate predictions Add human review of predictions Scale and manage the production environment Fully managed with auto-scaling for 75% less Choose or bring your own ML algorithm Collaborative notebooks, built-in algorithms/models トレーニング環境の設定と管理 ワンクリックでトレーニング モデルのトレーニング、 デバッグ、チューニング デバッグと 最適化 トレーニング実行 の管理 実験を視覚的に追跡して 比較する ML用ウェブベースのIDE モデルの自動構築とトレーニング
All rights reserved | 3rd party の HPO フレームワークも利用可能 「Amazon SageMaker で Optuna を用いたハイパーパラメータ最適化を実装する」 https://aws.amazon.com/jp/blogs/news/amazon-sagemaker-optuna-hpo/
All rights reserved | モデルの展開と管理 Collect and prepare training data Fully managed data processing jobs/ data labeling workflows Choose or bring your own ML algorithm Collaborative notebooks, built-in algorithms/models Set up and manage environments for training One-click training Train, debug, and tune models Debugging and optimization Manage training runs Visually track and compare experiments 本番環境での モデル展開 ワンクリックの展開 と自動スケーリング モニタリング モデル スポットコンセプ トドリフトの自動 検知 予測の検証 予測への ヒューマンレビューを 追加 本番環境の拡張と管理 フルマネージドの自動スケーリン グを75%のコスト削減で提供 ML用ウェブベースのIDE モデルの自動構築とトレーニング
All rights reserved | Amazon SageMaker 開発 Jupyter Notebook/Lab Amazon S3 学習 Amazon EC2 P3 Instances Amazon ECR The Jupyter Trademark is registered with the U.S. Patent & Trademark Office. 予め用意されている ビルド済みの Docker イメージ or BYOC
All rights reserved | Amazon SageMaker 開発 学習 Amazon EC2 P3 Instances Jupyter Notebook/Lab Amazon S3 The Jupyter Trademark is registered with the U.S. Patent & Trademark Office. トレーニングジョブのメリット: • API 経由で学習用インスタン スを起動、 学習が完了すると自動停止 • 高性能なインスタンスを 秒課金で、簡単にコスト削減 • 指定した数のインスタンスを 同時起動、分散学習も容易
All rights reserved | Amazon SageMaker 開発 学習 Amazon EC2 P3 Instances Jupyter Notebook/Lab Amazon S3 The Jupyter Trademark is registered with the U.S. Patent & Trademark Office.
All rights reserved | Amazon SageMaker 開発 学習 推論 Amazon EC2 P3 Instances Jupyter Notebook/Lab Endpoint/ Batch transform Amazon S3 Amazon ECR The Jupyter Trademark is registered with the U.S. Patent & Trademark Office.
All rights reserved | How Amazon SageMaker Pipelines works パイプライン実行の開始: • 手動 • データアップロード時の CloudWatch イベント • コード check-in (git push) Acceptable accuracy Non-acceptable accuracy Get input data Process data Train model Validation Deploy model Alert and stop