23新卒技術研修で実施したデータマネジメント研修の講義資料です。
動画:https://youtu.be/94U_sMinA8Q
資料の利用について 公開している資料は勉強会や企業の研修などで自由にご利用頂いて大丈夫ですが、以下の形での利用だけご遠慮ください。 ・受講者から参加費や授業料などを集める形での利用(会場費や飲食費など勉強会運営に必要な実費を集めるのは問題ありません) ・出典を削除または改変しての利用
©MIXIMIXI 23新卒技術研修データマネジメント研修2023/05/22開発本部 データグループ⾓⽥ 孝昭
View Slide
©MIXISpeaker Deck (など) でご覧の⽅へご覧いただきありがとうございます。年々データ利活⽤の需要は⾼まっています。データ利活⽤には、その前提となる⾼品質なデータ‧⾼品質なデータ環境が鍵となっています。ここで重要となるのは、これらの品質を⾼く保つためにはいわゆるデータエンジニアだけではなく、関係者全員が気を配らなければならない点です。以上のような背景を受け、MIXI では今年度より新卒研修に「データマネジメント」トピックを新設し、特に「データ品質」にフォーカスして講義を⾏いました。l 専⾨ではない⽅にはデータマネジメントやデータ品質を考えるきっかけとなれば幸いですl 専⾨の⽅には、組織的にデータマネジメントの考え⽅を広めるために、参考にできる点が少しでも⾒つかれば幸いです(そのような取り組みがよりオープンになることを願っています!)2
©MIXI⾃⼰紹介開発本部 > CTO 室 > データグループ⾓⽥ 孝昭(つのだ たかあき)l MIXI でのおしごと• データ利活⽤に関する知⾒を全社的に布教(本研修もその⼀環)• ⼩規模プロダクト‧バックオフィスなど、専任のデータ系エンジニアがいない組織への技術的⽀援(データ基盤構築‧データ分析‧ダッシュボード整備などデータ周りをフルスタックでやっています)l 前職では…• データ分析によるレコメンド改善⼿法の提案、機械学習を⽤いた不正利⽤対策など3猫を飼っています
©MIXI4講義のねらいデータマネジメント研修では、以下のポイントを(何となくで良いので)理解してもらい実際の業務で実践してもらうことを⽬指しています:1. データマネジメントとはどのような取り組みか?2. 良いデータとはどのようなデータか? データマネジメントはなぜ重要なのか?3. データマネジメントの取り組みのうち、特にデータの質に注⽬するものに何があるか?データの質を⾼めるためにそれぞれが⼼掛けたいこと‧実践できることは何か?
©MIXI5データ = 第四の資産ヒト‧モノ‧カネに次ぐ第四の経営資産としてデータの重要性が⾼まっている→ データの活⽤によって強⼒なビジネス価値を創出できるためl データ分析による現状把握、業務プロセス‧意思決定プロセスの改善• 経営に必要な指標(KGI, KPI, etc.)の把握• ⽇常業務(マーケティング、カスタマーサービスなど)の⽀援• ユーザー理解‧市場理解による意思決定の舵取りや精緻化• 実⾏した施策による効果の定量的検証(→ A/B テスト研修)l 機械学習による将来予測、新たな機能‧付加価値の提供• 時系列予測、異常検知• 推薦(レコメンデーション)• ⾃然⾔語処理: テキスト分類‧機械翻訳‧テキスト⽣成(チャットボット含む)• 画像処理: 画像分類‧顔/物体検出/認識‧画像⽣成• ⾳声処理: ⾳声認識‧⾳声合成
©MIXI6データ = 資産 → 正しく管理して初めて活⽤が可能になるヒト‧モノ‧カネ、どれも正しく管理しないと価値が毀損する‧価値を引き出せない恐れがある例: 誰が何をやっているのか‧何がどこにあるのか分からない、いつの間にかなくなってる、効率よく利⽤できていない、etc.→ 資産の価値を維持‧向上させ、価値を引き出せるようにするための取り組みが必要。例:l ⼈材管理 (human resource management)l 資産管理 (asset management)l 管理会計 (management accounting)データもこれらの資産と同様、先スライドのような活⽤のためには正しい管理を要するデータマネジメント (data management)データの価値を維持‧向上させ、価値を最⼤限に引き出せるようにするための取り組み
©MIXIデータマネジメントはなぜ必要なのか〜 データ活⽤を⽀える「良いデータ」とは? 〜7
©MIXI8データ活⽤の流れ: 省略されているモノとは図はよくあるデータ活⽤の流れ図だが…活⽤前処理分析機械学習 評価収集???▲ データ収集と⼀⼝に⾔うけれど…
©MIXI9データ活⽤の流れ: +活⽤⽬的の設定 +データ基盤の構築 (1/2)★ データ基盤の構築もデータマネジメントの取り組みの⼀環と⾔えますが、データマネジメントが対象としているスコープはもう少し抽象的かつ広いです(詳しくは後のスライドにて説明)活⽤前処理分析機械学習 評価データの収集‧蓄積‧加⼯‧提供提供蓄積収集処理⽬的設定経営戦略策定※最初に⽴てたビジネス⽬的と対応する必要があるこのような仕組みを実現するシステムをデータ基盤と呼ぶことがある
©MIXI10データ活⽤の流れ: +活⽤⽬的の設定 +データ基盤の構築 (2/2)問いの設定 データの収集‧管理 分析‧機械学習⼿法の適⽤活⽤前処理分析機械学習 評価データの収集‧蓄積‧加⼯‧提供提供蓄積収集処理⽬的設定経営戦略策定
©MIXI11良いデータ活⽤のために重要な要素とは?l 良い問いが必要な理由• データ活⽤による成果(意思決定をサポートする知⾒‧機械学習システムなど)は最初の「問い」に制約される• ましてや「データとツールはあるから取り敢えず分析」でビジネス活⽤に繋がる成果が出ることはほぼないl 良いデータが必要な理由• そもそも問いに対応するデータが無ければ問いに答えられない• データがあっても質が低ければ⾼度な⼿法をいくら適⽤しても無意味(Garbage In, Garbage Out)• データ分析の⼯数のうち、相当の時間がデータを探す‧品質を検証する‧前処理を⾏うことに費やされる良い問い 良いデータ 良い分析‧機械学習⼿法こちら側が圧倒的に重要!※⼗分に良い問いとデータが揃えばこちらも重要になる各段階で良いものが必要。その中でも重要なのは?
©MIXI12オープンな AI の躍進でデータはどうでも良くなったか?l ⾼度な「⼿法」を誰でも採⽤可能になった(なってしまった)• データ活⽤によって競合優位性を⽣み出すために「問い」や「データ」での差別化が重要になったl オープンな AI(ChatGPT 含む)はそのままでは「どこ/誰にでも当てはまる」出⼒しか得られない• ⾃社の状況や⾃社プロダクトに特化した出⼒を得るためにはそれらに合わせたデータが必要→ 質の良いデータをすぐに出せる企業が新技術を利⽤して優位性を確⽴しているきっと ChatGPT が何とかしてくれるから、⾃分たちで頑張ってデータを集めたりしなくても良いんじゃないの?むしろ逆! ⾃社データの重要性はかつてなく⾼まった
©MIXI13良いデータのためのデータマネジメント……では、データがどうなっていればビジネス要求に答えられるのか?l 質の良いデータをすぐに出せる環境が整っている 前スライドより「質の良い」とは? どのような環境だとすぐに出せるのか?l 考えるべきことは他にも⾊々セキュリティは確保できているか? データベースシステムの信頼性は⼗分か? etc.良いデータ = ビジネス要求(問い)に応えられるデータデータマネジメントはこのようにビジネス要求に応えられる「良いデータ」「良いデータ環境」とは何か?を考え、それを実現する様々な取り組みの総称とも⾔える
©MIXI良いデータにするために考えるべきこと★ 「Aiken のピラミッド」を引⽤の上和訳。引⽤元 ▼https://blogs.sap.com/2020/07/09/why-hr-data-management-strategy-is-important-in-your-hr-transformation/データ活⽤のためにはそれを⽀える「良いデータ」と「良いデータ環境」が必要考えるべきことを整理するとたくさんある(DAMA-DMBOK フレームワークによるデータマネジメント11個の知識領域をPeter Aiken がピラミッド化した図)14
©MIXIデータマネジメントの不備による問題 (1/3)★ 「Aiken のピラミッド」を和訳の上改変。引⽤元 ▼https://blogs.sap.com/2020/07/09/why-hr-data-management-strategy-is-important-in-your-hr-transformation/データ活⽤の⼟台であるデータマネジメントが不⼗分だとどうなるか?15
©MIXIデータマネジメントの不備による問題 (2/3)★ 「Aiken のピラミッド」を和訳の上改変。引⽤元 ▼https://blogs.sap.com/2020/07/09/why-hr-data-management-strategy-is-important-in-your-hr-transformation/不安定な⼟台に合わせて縮⼩= 課題解決⼒の低下不安定な⼟台から転落= 誤った意思決定の発⽣= 事業機会/収益/信⽤の損失16
©MIXIデータマネジメントの不備による問題 (3/3)★ 「Aiken のピラミッド」を和訳の上改変‧注釈を付与。引⽤元 ▼https://blogs.sap.com/2020/07/09/why-hr-data-management-strategy-is-important-in-your-hr-transformation/必要な時に必要なデータが取れないデータ同⼠を結合できないデータ利⽤者が利⽤の度にそれぞれ⼿元で⽣データを加⼯する必要がある⾒てはいけないデータが⾒れてしまうサービス利⽤規約‧プライバシーポリシーに従っていないデータ利⽤を⾏ってしまう仕様を調査するコストが発⽣するビジネス要求に対応したデータが存在しないビジネス要求と紐付かない冗⻑なデータが発⽣するアーキテクチャの変更に⼿が出せない必要なタイミングでデータが揃ってないデータが正しいかの確認に時間が掛かる誤集計に伴う業務ミス‧意思決定ミスが発⽣する計画書‧仕様書がどこにあるか不明どれが最新のものか不明分析⼿法が共有されていない分析⼿法が⼈によってまちまちデータマネジメントが⾏われない不要なダッシュボードができるダッシュボード間の数値が⾷い違う仕様上あるべきでないデータが混⼊している不備が引き起こす個々の具体的な問題(の⼀例)17
©MIXIデータ品質を⽀える取り組み〜 良いデータのためにできること 〜18
©MIXI19データ品質三領域に注⽬時間の都合上、本研修では特にデータの品質に関わる三領域を取り上げます良いデータ‧良いデータ環境から得られる恩恵を⽣かしたデータ活⽤参考: AI 研修, A/B テスト研修データ管理‧利⽤の統制に基づく戦略的取り組み⼟台領域の整備とガバナンスの実施が前提データを扱うためのシステム‧技術いわゆるデータエンジニアリングの主戦領域参考: DB 研修, セキュリティ研修データの品質を担保するための取り組み ←データマネジメントの⼟台となる重要な領域データ管理‧利⽤の統制と監督
©MIXI20データ品質三領域をなぜ取り上げるのか?データ品質はデータライフサイクルの全てに関係する = ほぼ全員に関係するため★ ⼀般的には「データライフサイクル」という場合「データの廃棄」も含む。本スライドでは省略している⽣成 収集 蓄積 処理 活⽤フロントエンド‧クライアント例: ユーザー情報‧⾏動などのデータをサーバーに送るインフラ‧バックエンド例: 受け取ったデータを保存する利⽤しやすい形に転送‧加⼯して提供するデータサイエンス‧機械学習‧AI例: データ分析により運営‧開発に必要な知⾒を得るML/AI 技術を適⽤して新たな機能を開発する※ここで挙げていない技術領域の⼈も、おそらくはどこかには関わることになるはず
©MIXI21データをめぐるすれ違い (1/2)データライフサイクルには様々な⼈が関わるため、データをめぐるすれ違いが発⽣しがちl 利活⽤に必要なデータ‧データ品質に対する理解の不⼀致l データの仕様変更で起こる影響の誤解l データの中⾝に対する認識の齟齬l データの問題を⾒つけられる⼈‧解決できる⼈が異なることによる対処の遅れや優先順位付けの対⽴★ ⼀般的には「データライフサイクル」という場合「データの廃棄」も含む。本スライドでは省略しているそれぞれで「⾒えている景⾊や得意なスキルセットが異なる」という前提を受け⼊れることが重要
©MIXI22データをめぐるすれ違い (2/2)データ A は iOS しか取れないけど問題はないはずこのデータに個⼈情報は無いはずデータ A は即時に提供できるように整備しようデータ B は次のアップデートから送らないようにしよう データ B の増加に耐えられるようサーバーを強化しよう全デバイスのデータ A が重要数値の計算に必要になるただし⽇に⼀回の参照で良いデータ B は必要だが軽量化した B’ でも⽬的は達成できそうデータ C は個⼈情報に該当するすれ違いの⼀例
©MIXI23すれ違いを防ぐにはどうすればよいか?l ビジネス⽬的達成のために必要なデータとデータ品質を定義‧合意するl データがどのようなものでどのような状況かを記述‧測定‧共有するこれらに関係者全員で取り組み、データの品質を担保することが重要DMBOK2 のデータ品質三領域はこのような取り組みを具体的に考えるもの
©MIXI24データ品質三領域: 概要ビジネス⽬的達成のために必要なデータとデータ品質を定義‧合意する → ①, ②データがどのようなものでどのような状況かを記述‧測定する → ①, ③12データ品質管理データの質はどうなっているか? そもそも質の良いデータとは?データの品質を定義‧測定‧監視して、より品質を⾼める取り組み3データアーキテクチャどのデータがどの⽤途‧⽬的で使われているのか?データとビジネスがどのように繋がっているかを記述‧整理する取り組みメタデータ管理このデータは何のデータなのか?データに関するデータ「メタデータ」を作成‧維持する取り組み
©MIXI25データ品質管理: ⾼品質なデータとは?以下の評価軸などがあるが、これがどの程度満たされるべきかはデータと要求によって異なる★ DMBOK2 表29「データ品質の⼀般的な評価軸」に⽰す8つの評価軸。説明は本発表⽤に要約したもの良いデータ= ビジネス要求に応えられるデータ= データ利⽤者の期待と要求を満たすデータ評価軸/測定指標説明正確性データが現実世界を正しく表しているか?完全性 必要なデータが全て存在するか?⼀貫性データの値がデータセット内で⼀貫しているか?整合性 データ間の関係に⽭盾は無いか?評価軸/測定指標説明妥当性データパターンが我々の想定する前提を満たしているか?適時性データが利⽤可能になるまでどのぐらい掛かるか?⼀意性/重複排除同じデータが重複して存在していないか?有効性 データ値は定義域の範囲内か?
©MIXI26データ品質管理: 必要な取り組み全ての品質項⽬が⾼ければ⾼いほど良い…というものではないl 例: ユーザーの年齢データの「正確性」を限りなく⾼めるなら本⼈確認⼿続きなどが必要• お⾦を取り扱うサービスや、マッチングサービスなどでは必要• ソーシャルゲームサービスなどでは明らかにオーバーな対応重要なのは、ビジネス⽬的から逆算して必要な品質項⽬を定義‧合意することその上でデータ品質を継続的に測定‧監視‧改善することデータは毎⽇のレポートに必要なので、毎⽇午前5時までに前⽇分のデータが参照可能なようにして下さい承知しました!合意内容はドキュメントに記録しておくデータ活⽤者は品質項⽬の定義を確認しながら利⽤できる(品質状況も確認できるとより理想)
©MIXI27データ品質管理: keypoint と action hintKEYPOINTl データ品質はビジネス⽬的から逆算して定義‧合意し、継続的に測定‧監視することが重要ACTION HINTl ⾃分が扱う(⽣成‧蓄積‧加⼯‧利⽤する)データが満たすべき品質を相談‧合意してみようl 品質を満たすためにできること‧品質を測定する⽅法を考えてみよう ※測定が難しい評価軸もあります• 例えば「データが NULL ではないこと(完全性)」を担保したければ、クライアント‧サーバサイドでのバリデーションや DB での NOT NULL 制約の導⼊などがある(制約を導⼊する場合は違反時の動作に注意が必要)• この場合、品質の測定は「NULL であったデータの個数‧割合」を数えることで可能KEYPOINTACTION HINT
©MIXI28データアーキテクチャとは?全てのデータは(少なくとも将来的には)何らかのビジネス⽬的のために収集‧蓄積されているはずこの「データ」と「ビジネス」間がどのように繋がっているかを⽰すものデータアーキテクチャが正しく検討‧記述されていないと……l ビジネス要求に対応したデータが存在しないことに後から気付く ↓l ビジネス要求と紐付かない冗⻑なデータが存在l データアーキテクチャの変更に⼿が出せなくなる機能 X の利⽤状況と課⾦ユーザー割合の関係を⽐較したいのですが……えぇっ!機能 X の利⽤ログは不要かと思って取ってませんでしたよ!◀ 検討が不⼗分だとこのような事態が発⽣するしかも必要なデータが存在しないことに気付くのは往々にして活⽤の段階に⼊ってから = 相当時間が経ってからその間に取りそこねたデータは取り直すことも往々にしてできない
©MIXI29データアーキテクチャ: 必要な取り組みまずはビジネス⽬的から逆算して必要なデータを洗い出す(既にプロジェクトが動いている場合は現状把握)最低限「データ」と「ビジネス」の対応を明確にしておくここまでできたら、ビジネス⽬的から要件を明確化して(先ほど説明した「品質」も含む)要件を満たすアーキテクチャを検討する(既にプロジェクトが動いている場合は理想の改善形を検討する)ユーザー情報 Aユーザー⾏動 Bユーザー⾏動 C︙ビジネス⽬的(機能 X)ビジネス⽬的(レポート Y)アーキテクチャ図は記録しておくアーキテクチャ図を確認しながらデータやアーキテクチャの変更が可能に
©MIXI30データアーキテクチャ: keypoint と action hintKEYPOINTl データとビジネスとの対応が明確で、データの変更による影響が分かっていることが重要ACTION HINTl ⾃分が⽣成するデータが何に‧どのように利⽤されるかを明らかにしてみようl ⾃分が実装する機能がどのデータに依存しているかを明らかにしてみようKEYPOINTACTION HINTYGoogleAnalyticsRDB ユーザー情報 Aユーザー⾏動 Bユーザー⾏動 C︙ データレイク層ユーザー情報同期テーブルGoogle Analytics⽣テーブルデータウェアハウス層ユーザー情報クレンジング済ユーザー⾏動クレンジング済データマート層機能 X ⽤加⼯済みテーブルレポート Y ⽤加⼯済みテーブル…【発展】ビジネス要件を明確にできたら、要件を踏まえた上でより具体的な実現⽅法も検討する※アーキテクチャ図の簡単なイメージ図
©MIXI31メタデータ管理: メタデータとは?あるデータがどのようなものかを説明するデータメタデータが無いとデータの調査コストに相当の時間を要する最悪、データが完全に使い物にならなくなったり、集計ミスを引き起こしたりするリスク架空の課⾦記録テーブルtime のタイムゾーンは⽇本で良い?マイナスの price はどういう意味?何かの間違い?code の数字は何を意味している?transaction_id time price code ...515215928 2023/05/22 16:15:00 24.99 2 ...515215929 2023/05/22 16:15:22 -11.99 7 ...515215930 2023/05/22 16:17:13 5.00 2 ...これらの疑問が解決しないとデータを利⽤できなかったり誤集計が発⽣したりする ▶
©MIXI32メタデータ管理: メタデータの恩恵データの説明があればデータを安⼼して利⽤できるtransaction_id time price code ...515215928 2023/05/22 16:15:00 24.99 2 ...515215929 2023/05/22 16:15:22 -11.99 7 ...515215930 2023/05/22 16:17:13 5.00 2 ...架空の課⾦記録テーブル架空の課⾦記録テーブルのカラム説明• transaction_id: 課⾦記録の ID (unique)• time: 課⾦時刻 (UTC)• price: 課⾦額 (USD)。消費税を含む。マイナスの場合は返⾦額を表す• code: 2: クレジットカードによる課⾦, ..., 7: 返⾦• ...
©MIXI33メタデータ管理: メタデータの種類l ビジネスメタデータデータセット‧テーブル‧カラムの定義と説明(値の範囲、計算⽅法含む)、個⼈情報の有無、データオーナー、etc.l テクニカルメタデータアクセス権、キー‧インデックス、データリネージ(データの上流‧下流に関する情報)、etc.l オペレーショナルメタデータバッチプログラムのジョブ実⾏ログ、エラーログ、アクセスパターン、バックアップ規定、廃棄基準、etc.メタデータの種類は多いが、最初はテーブル‧カラムの説明と個⼈情報の有無が分かれば良い記述すべきメタデータが多すぎて頓挫するよりは、最⼩限でも書かれている⽅が圧倒的に良い
©MIXI34メタデータ管理: keypoint と action hintKEYPOINTl 少なくともテーブル‧カラムの説明と個⼈情報の有無が分かることが重要ACTION HINTl ⾃分が⽣成するデータの説明をデータベースシステム and/or ドキュメントに書いてみよう• ほとんどのデータベースシステムでテーブルやカラムの説明が書けるはず(下図)l ⽤語集を作ってみよう• メタデータがあっても、業界/社内/チーム/プロダクト⽤語が分からないと結局データが理解できないケースも• 現場では⾃然に使ってしまっている⽤語を、新卒のまっさらな⽴場で指摘してもらえると助かりますKEYPOINTACTION HINT◀ 例: BigQuery の「スキーマ」画⾯カラムの説明を書くことができるこれが無いと有るとではデータ管理者‧利⽤者の⼿間が天と地ほども異なってくる
©MIXI35まとめデータマネジメント = 良いデータ‧良いデータ環境とは何かを考え実施する取り組みこのうちデータ品質に関わる三領域は以下の通り:l データ品質管理• keypoint: データ品質はビジネス⽬的から逆算して定義‧合意し、継続的に測定‧監視することが重要• action: ⾃分が⽣成‧蓄積‧加⼯‧利⽤するデータが満たすべき品質とその測定⽅法を考えてみようl データアーキテクチャ• keypoint: データとビジネスとの対応を明確にして、データの変更による影響が明らかになっていることが重要• action (1): ⾃分が⽣成するデータがどのように利⽤されるかを明らかにしてみよう• action (2): ⾃分が実装する機能がどのデータに依存しているかを明らかにしてみようl メタデータ• keypoint: 少なくともテーブル‧カラムの説明と個⼈情報の有無が分かることが重要• action (1): ⾃分が⽣成するデータの説明をデータベースシステム and/or ドキュメントに書いてみよう• action (2): ⽤語集を作ってみよう
©MIXI参考⽂献‧読書案内36
©MIXI参考⽂献‧読書案内: 次に読むべき!いずれも今回扱わなかったデータマネジメント領域について簡単に説明していますデータマネジメントへの理解を深めるため、次に読むべき資料としてオススメです!l [発表] データマネジメントなき経営は、破綻する。 #dl_guild / 20200419 - Speaker DeckhWps://speakerdeck.com/yuzutas0/20200419l [発表]データマネジメントなきMLは、破綻する。 - MLCT / 20200528 - Speaker DeckhWps://speakerdeck.com/yuzutas0/20200528• 機械学習に携わる⼈は2つ⽬、それ以外の⼈は1つ⽬がオススメl [書籍] ゆずたそ 編著‧はせりょ‧株式会社⾵⾳屋(2020)『データマネジメントが30分で分かる本』• ¥500(本研修時点)でデータマネジメントの取り組みがざっくり理解できる良書実際の業務で使われるような図表が多数含まれているのも⾮常に参考になります37
©MIXI参考⽂献‧読書案内: データマネジメントについてデータマネジメントの本質は「組織的に取り組むこと」なので、体系的な解説書は責任的⽴場の⼈向け⼊社したての時点だと少し分かりにくいかもl [書籍] ⼤川真輝(2023)『DX 時代のデータマネジメント⼤全 DX、データドリブン経営、データ利活⽤から理解する』翔泳社.• この中では⽐較的読みやすいと思いますデータマネジメントの詳細な説明が後半なので⼀⾒遠回りですが、データマネジメントは経営戦略を受けて実施するものなので、それぞれの取り組みが「どうして必要なのか?」が分かりやすいですl [書籍] データ総研‧⼩川康⼆‧伊藤 洋⼀(2021)『DXを成功に導くデータマネジメント データ資産価値向上と問題解決のための実務プロセス75』翔泳社.l [書籍] DAMA International (2017). DAMA-DMBOK: Data Management Body of Knowledge: 2nd Edition.(DAMA ⽇本⽀部‧Metafind コンサルティング株式会社訳 (2018). データマネジメント知識体系ガイド 第⼆版. ⽇経BP)• 通称 DMBOK2。データマネジメントのバイブル的な位置付け電話帳サイズなのでまずは解説書から⼊るのがオススメ(ここから読み始めると 100% 挫折する)38
©MIXI参考⽂献‧読書案内: データエンジニアリング∕データ分析l [書籍] ゆずたそ‧渡部徹太郎‧伊藤 徹郎(2021)『実践的データ基盤への処⽅箋〜 ビジネス価値創出のためのデータ‧システム‧ヒトのノウハウ』技術評論社.• 3章構成のうち、新卒には1〜2章のデータ‧データ基盤整備の話が実践的でオススメ本研修では盛り込みきれなかった「具体的な取り組み」について、実務経験を踏まえてまとめられていますl [発表] DXの本丸は「データ」にあり 「問い」からはじめるデータ分析とその活⽤法 - ログミーBizhttps://logmi.jp/business/articles/326745• 本研修で触れなかった「良い問い」とは何かを分かりやすく解説。ビジネス思考として有⽤なので全員にオススメl [書籍] 株式会社ブレインパッド他(2018)『失敗しない データ分析‧AIのビジネス導⼊:プロジェクト進⾏から組織づくりまで』森北出版.• 本研修ではとてもカバーしきれない「データ分析プロジェクトにありがちな落とし⽳」を、 AI‧データ分析のコンサルを⼿掛ける著者陣の経験から幅広く網羅、回避⽅法を解説。AI/ML/分析職にオススメ39
©MIXI