Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2023サンフランシスコ出張報告 〜ダッシュボードが自動生成される時代に、 データ人材に求められる働き方を考える〜 #DataEngineeringStudy / 20231212

2023サンフランシスコ出張報告 〜ダッシュボードが自動生成される時代に、 データ人材に求められる働き方を考える〜 #DataEngineeringStudy / 20231212

Data Engineering Study #22 の登壇資料です。
https://forkwell.connpass.com/event/299633/

<採用・カジュアル面談>
https://kazaneya.com/recruit

<サービス提供>
https://kazaneya.com/service

風音屋 (Kazaneya)

December 12, 2023
Tweet

More Decks by 風音屋 (Kazaneya)

Other Decks in Technology

Transcript

  1. データエンジニアリング特化の専門会社「風音屋」 事業概要 • データ基盤の構築、運用保守 • データ分析コンサルティング • 月30万円でデータ分析組織を立ち上げる支援パッケージ 「Kazaneya Virtual

    Data Team」(ベータ版)の提供 取引先(一部抜粋) • プライム上場:製造、物流、金融、エンタメ • グロース上場 :人材、通販、販促ツール • 未上場:不動産、自動車販売、音響制作 余談 今回の Data Engineering Study 登壇者の半分が風音屋Slackにいる……! (勉強会で話すような内容を日々チャットでディスカッションしています🙌) 3

  2. 風音屋 代表取締役 4
 横山 翔(@yuzutas0) • リクルートやメルカリにてデータ活用を推進、AWSを経て、現職 • 東京大学 経済学研究科

    金融教育研究センター 特任研究員を兼任 • Googleが認定する技術エキスパート Google Cloud Champion Innovator (Data Analytics) 主なコミュニティ活動 • 累計視聴者10,000名以上の勉強会「Data Engineering Study」企画・運営(#1から3年以上) • 1,000名以上が参加するSlackコミュニティ「datatech-jp」発起人&運営メンバーの1人 主な登壇・発表 • Pythonのカンファレンス PyCon JP 2017 にてベストトークアワード優秀賞 • Google主催 Google Cloud Day ‘21, ‘23, Google Cloud Next Tokyo ‘23 • 日本統計学会 第16回春季集会 主な執筆・出版 • 内閣府『経済分析 第208号 - 景気動向分析の新たな潮流』 • 技術評論社『実践的データ基盤への処方箋』 • 技術評論社『Software Design 2020年7月号 - ログ分析特集』 • 風音屋『データマネジメントが30分でわかる本』
  3. ③データベースに対するクエリの作成補助 • データ分野に限らず GitHub Copilot や Chat GPT Code Interpreter

    など、多数の商用製品が台頭 • データ分野に特化すると、Snowflake Copilot など、各ベンダーが補助機能の提供を発表している • 風音屋のクライアントの例だと、SlackBotでデータ利用者の問い合わせ対応をしたり、 SQLの作成を補助する独自ツールを社内提供していたりする。 9
 https://investors.snowflake.com/news/news-details/2023/Snowflake-Puts-Industry-Leading-Large-Language-and-AI-Models-in-the-Hands-of-All-Users-with-Snowflake-Cortex/default.aspx
  4. Google Cloud Next とは 12
 会場入口の様子 Google Cloud Nextとは、Google Cloudの最新情報やビジネス活用の事例を紹介するイベントです。

    基調講演から始まり、各トピックのセッションに参加したり、ブースで話を聞いたりすることができます。 なお、セッションの動画は公開されるので、オンラインで後から視聴することも可能です。 今回のGoogle Cloud Next '23は、アメリカ・サンフランシスコのMoscone Centerにおいて、 3日間(現地時間 2023/08/29〜2023/08/31)にわたって開催されました。 ※本日の話はGoogle Cloudに  閉じない内容となります。
  5. Duet AI for Looker Studio Pro 15
 • 自然言語で「売上トップの商品カテゴリを教えて」と質問すると、複数のグラフが自動生成 •

    スコアボード形式で売上総額を、テーブル形式でカテゴリランキングと四半期の上昇率を、 マップ形式で国別の売上を表示。
  6. 現時点でのイラストAI の Fit & Gap 19
 <アンマッチなケース> • イラストAIは、イラストを自由自在に描ける人からすると「痒いところに手が届かない」 「手直しで余計に時間がかかる」といった不便さも目立つ

    • 人気ゲームのパッケージイラストであれば描き下ろしのほうがマッチする (ゲームクリア後に気付ける意図や仕掛けが散りばめられた渾身の1枚絵であってほしい) <マッチするケース> • 自力でイラストを書けない人が、個人ブログの見出し画像を作ったり、 LINEやSlackのアイコン画像を作るだけなら、これ以上なく便利なツール • 好みのテイストにあった学習モデルを選び、プロンプトを調整しながら画像を生成しまくって、 最後にベストショットを選別すれば終了 → おそらくダッシュボード生成AIも同じような位置付けになるのではないか
  7. イラストAIから予想しうる Generative BI の Fit & Gap ① 20
 <アンマッチなケース>

    • 一流データアナリストの100点を再現するツールではない ◦ せいぜい50点しか取れないのではないか • クリティカルな業務では、ハイスキルなデータ人材をアサインしたほうが良さそう ◦ コアとなる経営指標の設計 ◦ グロース戦略に関わる根幹のモニタリング ◦ IRで投資家に開示するようなデータの取得・抽出 ◦ 共通指標として横断で管理/定義すべきデータ(データモデリングが必要) ◦ データ仕様や歴史的経緯が複雑で、要件定義・テスト設計や複数人レビューが必要となる分析 • ビジネスの意思決定においては「自動生成されたものを使います」(思考放棄)が許されない場面、 「根拠にもとづく説明」「根拠にもとづくブラッシュアップ」が必要となる場面は多々ある → ツールを使えるだけ、データ集計・抽出できるだけのジュニア人材だと、対応しきれないかも?   これまで以上にプロフェッショナルなシニア人材に需要が偏る?
  8. イラストAIから予想しうる Generative BI の Fit & Gap ② 21
 <マッチするケース>

    • 「10秒で50点のダッシュボードが作れる」というのは革命的なUX ◦ GenBIが社内データを参照できるように、データを一元管理しておく必要はある • ちょっとした施策のモニタリング程度であれば50点のダッシュボードで問題ない ◦ ジュニア人材の成果物は50点に満たないことも多い(それで今の仕事は回っている) ◦ ハイスキル人材が100点のクオリティで仕上げても「そこまでしなくていい」と言いたくなる ◦ 100点ではないので、気軽に壊せる(=軌道修正しやすくなる) • データ専門職に仕事をお願いして1週間待つよりも、圧倒的に素早く、格安でPDCAサイクルを回せる ◦ 業務担当者が自分でデータを見ることで、データ分析&業務改善が一気に進む ◦ データを見るのはあくまで手段 / 「課題発見→改善」のサイクルを回すことが大事 → データ利用者の裾野が広がり、より多くの人がデータを活用しやすくなる?   これまで以上にデータ整備が重要になる?
  9. 余談:LLM / GenAIでよく挙げられる批判と回答 22
 【機能追加や技術革新で解決するケース】 例:AI生成ダッシュボードが量産されたら管理が大変になる! →Pixivさんのようにフィルタリングできれば良いのでは? (課題に対する打ち手を講じれば良い) 【AIナシでも同じ問題が起きるケース】 例:AI生成ダッシュボードだとSQLがカオスで調査しにくい!

    →今のジュニア人材や非データ職が作ったSQLは調査しやすいのか? (AIがなくても同じ問題が起きている) https://www.pixiv.help/hc/ja/articles/18685842478361 🤷専門家が自分の従来の仕事を守るために新しい技術を批判することはよくある 💪技術を利用する時に課題が出てくるのは当然/それを解決するのがエンジニア 💸新しいテクノロジーは素直に試して、変化に適応するスタンスのほうが建設的 🏄パラノイア(悲観論者)だけが生き残る⇒自己弁護に逃げずに変化を楽しもう
  10. キャリアの方向性②:分野特化プラン 25
 <データ分析人材のキャリアの方向性> 特定の産業・分野に特化する! • 例:製造業データマネジメント • 例:人事データ分析 • 例:月面データの位置情報エンジニアリング

    (緯度経度やIPアドレスがそのまま使えない) <風音屋で2023年に試したこと> • (以前から)各クライアントワークでの業界知識キャッチアップは都度実施 • 短期間でドメイン知識を叩き込むメソッドの開拓・模索 • 「これが自分の武器です」と言えるようにスキル向上を追求できる目標管理シート • クライアント企業への出向・兼務 → データチームを立ち上げて担当事業にコミット (事業会社に転職するケースと異なり、風音屋のリソースやノウハウを横展開できる)
  11. キャリアの方向性④:活用支援プラン 27
 <データ分析人材のキャリアの方向性> データ利用者の活動をサポートする! (Sales、CS、コンサルタント的な存在) 例 • Analytics Enablement(HubSpot) •

    Data Champion(GitLab) <風音屋で2023年に試したこと> • 「データ抽出・集計」の依頼対応を減らし「Enablement」に舵を切る • データ活用支援パッケージ「Kazaneya Virtual Data Team」では 各チームが自分たちでデータを見る前提でツール選定、会議設計、サポート体制を構築 • エンジニア/アナリスト→コンサルタントに方向転換するための育成メニューを整備
  12. まとめ 30
 <2023年の出来事> • サンフランシスコの気候とご飯は最高だった、治安は…… • 2023年はLLM/GenAIをデータパイプラインに組み込む事例が一気に増えた • 各ソリューションベンダーは「10秒でダッシュボードを作れる未来」を提示した •

    データ職以外が50点のダッシュボードでPDCAサイクルを回せる未来が来るかも <データ人材のキャリア> • ツールを使えるだけのジュニアなデータ人材にとっては逆風かも • 分野特化、上流工程、活用支援、GenAI担当に回るといったキャリアの方向性があるか • いずれの場合もシニア人材として活躍できる土台となるスキルが必要そう • 風音屋ではデータ人材のキャリア開拓のために、各アプローチを実験している