Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Dataiku Learning Pathのススメ 分かるのは、Dataikuの本質的な価値 ...

Avatar for Satoshi Ganeko Satoshi Ganeko
June 27, 2025
38

Dataiku Learning Pathのススメ 分かるのは、Dataikuの本質的な価値 / Let's walk along Dataiku Learning Path

2025/6/26
Data Hailker EventでのLT用スライドです。

Avatar for Satoshi Ganeko

Satoshi Ganeko

June 27, 2025
Tweet

Transcript

  1. Dataiku Learning Pathを始めたきっかけ Everyday AI In Tokyo 2024に参加 無料版の Dataiku

    利用開始 学習しながら 資格も取れる Learning Path を追い始める
  2. プロジェクト開始 データ接続 データ把握 データ可視化 前処理 地理的データ、時系列データ、自 然言語、画像、LLM利用、あいま いマッチング、地理的結合 統計 相関行列、t検定

    カイ2乗検定他 特徴量設計 予測モデル作成 予測実施 What if simulation、特徴量の重 要度、Confusion Matrix、 Feature Importance、ROC曲線他 デプロイ(オートメーション化) データ接続 前処理 予測モデル 予測実施 データ保存 外部配信・アプリ化 Responsible AI (責任あるAIの利用) のために • Documentationの 重要性 • バイアスについて の注意事項 • モデルの公平性 • 解釈性、透明性 • Black Box化の危険 性 • Data Qualityの低下、 モデルの目的外 使用の注意 Collaboration データ品質 監視 特徴量操作 モデル精度 継続監視 モデル 再学習 Dashboard
  3. なぜ、Learning Pathをススメるのか? Dataikuの目指す世界観の全体像が分かる • Data Prepツールとの比較 • Tableauとの可視化部分の比較 • Notebook(Python他)でのモデル作成

    との比較 といった、個別のパーツの比較にはさほど 意味はない。 比較の対象は ・現状の社内での、データの利用状況 ・広義のAIでデータから価値を生む 理想的な体制 ハンズオンなどの Dataiku紹介での時間的制約 データ操作から・・ 時間があればモデル作成と予測。 ↓ あとは LLM、RAG、生成AIの 話になる場合が多い。 ↓ Dataikuの支えるMLOps には、短時間ではたどり着かない。
  4. recipe自体の中に、Pre Filter、Post Filter、 Computed Columnsを作 るStepがある Dataiku自身が、正規表 現の書き方を判断、提案 してくれる機能が秀逸 IF

    THEN ELSE文で、直接、 既存のFieldの中身を書き 換えられるのが便利。UIも Good! DataのFieldの使われ方 が目に見えるData Leakage機能 地理的結合の充実。 結合方法の説明イラストが とても分かり易い! どこで処理が行われるかを はっきり示す、処理 Engine表示機能 私のDataiku推し機能!
  5. ラ ー ニ ン グ パ ス 歩 ん で

    育 む デ ー タ の 価 値