SageMaker Data Wranglerについて話しましたーー
AWS re:Invent 2022re:Cap• 2022/12/14• 古賀 巧
View Slide
2自己紹介■氏名・年齢古賀 巧(@koara__fftr) 27歳■経歴SESでドライバーの開発・保守■資格■趣味音楽
re:Invent2022Twitterなどで最新情報を確認しながら日本から参加毎日(できる限り)キーノート視聴とre:Capに参加Youtubeチャンネル Amazon Eventsでセッションを追う
Amazon SageMaker Data Wrangler を知ってるかい
SageMaker StudioのUIが刷新
一般的な機械学習フローは
モデル作成よりもデータ準備に時間がかかる外れ値特徴量エンジニアリングデータ形式
Amazon SageMaker Data Wrangler機械学習 (ML) 用のデータを集約して準備するのにかかる時間を数週間から数分に短縮します。SageMaker Data Wrangler を使用すると、データ準備と特徴量エンジニアリングのプロセスを簡素化し、データ選択、クレンジング、探索、視覚化など、データ準備ワークフローの各ステップを単一のビジュアルインターフェイスから実行できます。
まずはデータをインポートAmazon AppFlowでコネクタを設定
どんなデータか確認
データを整形
その他の操作
Data WranglerをStudio notebookから利用可能にデータ変換の方法を選択すると、Studio notebookがコードを生成するので、同じ処理を好きな時に実行できる
notebookにデータを読み込む
データが準備できたらAutopilotにまかせるだけノーコード・ローコードでモデル作成まで完了
ご清聴ありがとうございましたre:Invent 2023はラスベガスでお会いしましょう