$30 off During Our Annual Pro Sale. View Details »

JAWS-UG大阪 AWS re:Invent 2022 re:Cap

koara
December 15, 2022

JAWS-UG大阪 AWS re:Invent 2022 re:Cap

SageMaker Data Wranglerについて話しましたーー

koara

December 15, 2022
Tweet

More Decks by koara

Other Decks in Technology

Transcript

  1. AWS re:Invent 2022
    re:Cap
    • 2022/12/14
    • 古賀 巧

    View Slide

  2. 2
    自己紹介
    ■氏名・年齢
    古賀 巧(@koara__fftr) 27歳
    ■経歴
    SESでドライバーの開発・保守
    ■資格
    ■趣味
    音楽

    View Slide

  3. re:Invent2022
    Twitterなどで最新情報を確認しながら日本から参加
    毎日(できる限り)キーノート視聴とre:Capに参加
    Youtubeチャンネル Amazon Eventsでセッションを追う

    View Slide

  4. Amazon SageMaker Data Wrangler を
    知ってるかい

    View Slide

  5. SageMaker StudioのUIが刷新

    View Slide

  6. 一般的な機械学習フローは

    View Slide

  7. モデル作成よりもデータ準備に時間がかかる
    外れ値
    特徴量エンジニアリング
    データ形式

    View Slide

  8. Amazon SageMaker Data Wrangler
    機械学習 (ML) 用のデータを集約して準備するのにかかる時間を
    数週間から数分に短縮します。
    SageMaker Data Wrangler を使用すると、データ準備と特徴
    量エンジニアリングのプロセスを簡素化し、データ選択、クレンジング、
    探索、視覚化など、データ準備ワークフローの各ステップを単一のビ
    ジュアルインターフェイスから実行できます。

    View Slide

  9. まずはデータをインポート
    Amazon AppFlowでコネクタを設定

    View Slide

  10. View Slide

  11. どんなデータか確認

    View Slide

  12. どんなデータか確認

    View Slide

  13. データを整形

    View Slide

  14. データを整形

    View Slide

  15. その他の操作

    View Slide

  16. Data WranglerをStudio notebookから利用可能に
    データ変換の方法を選択すると、Studio notebookが
    コードを生成するので、同じ処理を好きな時に実行できる

    View Slide

  17. notebookにデータを読み込む

    View Slide

  18. データを整形

    View Slide

  19. データを整形

    View Slide

  20. View Slide

  21. データが準備できたらAutopilotにまかせるだけ
    ノーコード・ローコードでモデル作成まで完了

    View Slide

  22. ご清聴ありがとうございました
    re:Invent 2023はラスベガスでお会いしましょう

    View Slide