Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20241210_第2回_データサイエンティストの応援団_ゲスト市川さん

 20241210_第2回_データサイエンティストの応援団_ゲスト市川さん

NobuakiOshiro

December 10, 2024
Tweet

More Decks by NobuakiOshiro

Other Decks in Technology

Transcript

  1. Copyright © 2024 NOB DATA All Rights Reserved. 本⽇の流れ •

    概要説明 5分 • 各⾃⾃⼰紹介 5分 • ゲストへのインタビュー 15分 • 議論 & 次回案内 20分 ランチ⾷べながらで⼤丈夫ですので どうぞよろしくお願いします 12:00-12:45 あと⼀部のセッションは録画しますの でNGな⽅はご連絡ください
  2. Copyright © 2024 NOB DATA All Rights Reserved. ⾃⼰紹介 ⼤城信晃(twitter

    @doradora09) NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会九州⽀部 委員⻑ / iU 情報経営イノベーション専⾨職⼤学 客員教員 ・住まい 沖縄 -> 東京 -> 福岡 ・職歴 ヤフー(2009) -> DATUM STUDIO(2015) -> LINE Fukuoka(2017) -> NOB DATA(2018) ・運営コミュニティ ・Tokyo.R(2010-2016) ・2017年〜現在 ・fukuoka.R、PyData.Fukuoka、 オモシロAIごった煮勉強会、ChatGPT部、 AGI福岡、他2つ データ分析系コミュニティの運営を やっていたらDSが本業になった時代の⼈です
  3. Copyright © 2024 NOB DATA All Rights Reserved. データサイエンティストの応援団とは •

    NOB DATAが発起⼈となり、企業、アドバイザー、地⽅DSコミュニティのエコシ ステム作りを⽬指す「個々⼈のネットワーク」 • スポットコンサルを中⼼に、費⽤の⼀部をコミュニティに還元することで地域の DSエコシステム構築をめざしています。 https://speakerdeck.com/doradora09/20241111- tetasaienteisutonoying-yuan-tuan-nomu-ji-tojie-shuo- 15minban
  4. Copyright © 2024 NOB DATA All Rights Reserved. ゲストへのインタビュー •

    DSになったきっかけ • DSの⾯⽩いところ / ⼤変なところ • 応援したいコミュニティ などなど。 他、質問ありましたらコメント欄にてお寄せください。
  5. Copyright © 2024 NOB DATA All Rights Reserved. データあってのデータサイエンティスト •

    「データ」サイエンティストなので基本はデータを扱うお仕事 • ただ、「データ」が無いケースは多数です。仮にデータがあると⾔われても 「紙」だったケースなどは多々あると思います ( データ分析は前処理8割、ともよく⾔われます ) • ⼀⽅でデータ整備やデータ分析基盤の構築には先⾏投資も必要です。 この辺りをこれからデータサイエンスを始めよう、という企業において ( 特に⼀⼈DSの場合を想定して ) 議論できればと思います。
  6. Copyright © 2024 NOB DATA All Rights Reserved. 参考の⼀つ:AIデータ分析プロジェクトのすべて •

    ちなみに2023年に発売したこちらの書籍では⽬的に応じたデータ収集の話をして います( 該当スライドは油井さんの作成パート ) データで話す組織(技術評論社、2023年) より
  7. Copyright © 2024 NOB DATA All Rights Reserved. 参考の⼀つ:AIデータ分析プロジェクトのすべて •

    ちなみに2020年に発売したこちらの書籍では⻄原さんが 「いきなり分析基盤を作らない」という名⾔も残されてます AIデータ分析プロジェクトのすべて(技術評論社、2020年) より
  8. Copyright © 2024 NOB DATA All Rights Reserved. 参考の⼀つ:マルチビッグデータ(1/3) •

    私の古巣のヤフー やLINE等の企業で は「ビッグデー タ」を組み合わせ ることで様々な データ分析が可能 となっています(マ ルチビッグデータ) • アドテクやマーケ 系の場合はこのよ うなデータは価値 を⽣みます (ChatGPTでサンプルデータを⽣成) Timestamp プラットフォーム ⾏動種別 ⾏動内容/詳細 補⾜情報(端末・ 状況など) 06:30 Yahoo!天気 天気情報閲 覧 朝起きてすぐにスマホで 天気予報チェック(当⽇ の気温・降⽔確率) スマホ(Android) ⾃宅寝室 06:35 Yahoo!ニュース ニュース閲 覧 経済ニュース、社会 ニュースを数本チェック スマホ(Android) 朝⾷準備中 07:00 Yahoo!乗換案内 経路検索 通勤経路混雑状況を確認 (いつもの路線に遅延が ないかチェック) スマホ(Android) ⾃宅 07:10 Yahoo!ショッピン グ 商品閲覧 妻から伝えられた「⼦供 ⽤⽔筒」を検索して商品 詳細ページを閲覧 スマホ(Android) 通勤準備中 07:30 Yahoo!メール メール受信 閲覧 通勤途中で「Yahoo!メー ル」の受信箱チェック、 顧客からの依頼メール スマホ(Android) 通勤電⾞内 08:00 Yahoo!ファイナン ス 株価チェッ ク オフィス到着前に保有銘 柄と⽶国市場終値を確認 スマホ(Android) 駅近くのカフェ 09:00 Yahoo!ニュース ニュース閲 覧 オフィスでPCから業界 ニュースやIT関連トピッ クを確認 PC(オフィス), Chromeブラウザ 1⽇のヤフーサービス利⽤例
  9. Copyright © 2024 NOB DATA All Rights Reserved. 参考の⼀つ:マルチビッグデータ(2/3) •

    私の古巣のヤフー やLINE等の企業で は「ビッグデー タ」を組み合わせ ることで様々な データ分析が可能 となっています(マ ルチビッグデータ) • アドテクやマーケ 系の場合はこのよ うなデータは価値 を⽣みます (ChatGPTでサンプルデータを⽣成) ⼤原則として、 データの裏には⼈がいる
  10. Copyright © 2024 NOB DATA All Rights Reserved. 参考の⼀つ:マルチビッグデータ(3/3) •

    データを使った新規事業や、既存事 業の効率化なども可能となります • これからDS組織を作る場合は、 「⾃社組織」でどこまでデータを貯 めるべきか、ビジネス都道接続する か、は要検討な事項となります ( それにより投資額も変わるので ) • ちなみにWeb広告の世界はクリッ ク率が1%改善できれば数⼗億売り 上げが上がる世界なので、⼤規模投 資も可能だったりします。 ヤフーのDS.INSIGTの例 https://ds.yahoo.co.jp/
  11. Copyright © 2024 NOB DATA All Rights Reserved. 参考の⼀つ:データサイエンスと相性のよい職種 •

    右の図は2020年頃 のDS⼈材の求⼈の 業種別の分布 • ⾒⽅を変えると 「データがビジネ スに直結している 業種」とも⾔えま す • DXの場合はおそら く中程でのスター トなので、試⾏錯 誤とどこまでやる かは要検討です 参考︓https://www.fnn.jp/articles/-/56285 DXにトライしている 業種 DSで成果が 出ている業種
  12. Copyright © 2024 NOB DATA All Rights Reserved. 参考の⼀つ:スモールデータ、の価値 •

    ⼀⽅で医療の世界では「治験」のデータ収集にはかなりコストがかかるので、 「なるべく少ないサンプルサイズで効果検証をしたい」というニーズがありま す • 医療統計の世界などでもデータサイエンスの前進である「統計学」はフル活⽤ されています。
  13. Copyright © 2024 NOB DATA All Rights Reserved. 参考:⾃社組織がどのフェーズにあるか? •

    地⽅でこれからDS組織 を、という場合、必ず しも「⾼度化」が重要 なわけではないです • 個⼈的にはDS組織を作 るには「IT化」及び 「経営陣をいかに説得 するか」のスキルは重 要だと思ってます ( コンサルスキル ) • 担当者のマインドセッ ト周りの理解、も東京 ベースでは読み違える ことが多いです IT : システム化 (5年) PCがあるか / メールアドレスがあるか / 社⽤スマホがあるか / LINE works等があるか / 情シスがいるか、etc.. データ基盤・DSチーム( 5〜10年 ) データ基盤はあるか / データ運⽤チームはいるか / デー タアナリストはいるか / DS⼈材はいるか / 専⾨職制度が あるか / 経験者がいるか / 社内意思決定に関与できる か、etc.. AIチーム( 3年〜5年 ) 専⾨⼈材がいるか / ビジネスとの接続がで きるか / 内製化するだけの費⽤対効果が出 るか / 定着するか / 中途採⽤できるか / 社 内からのAIへのアレルギーは出ないか、etc..
  14. Copyright © 2024 NOB DATA All Rights Reserved. ⾃⾝の専⾨スキルの現状とどう伸ばすか •

    午前中のスキル定義委員会のセッションでもありましたが、DSのスキルセット の3つの輪、に掛け合わせるなら個⼈的には「影響⼒」かなと思ってます ビジネス⼒ データ サイエンス⼒ データ エンジニア リング⼒ + 影響⼒ • 社内成果 • データ理解 • 業務理解 • ⼈脈 • コミュニティ • 仲間 • LT/登壇 • 書籍/論⽂執筆 • 副業/起業 • ⽀援/投資 • etc..
  15. Copyright © 2024 NOB DATA All Rights Reserved. データサイエンティストの応援団 •

    こちらは協会活動とは別で、NOB DATAが今回新たに提供する「スポットコンサル ティング」サービス(ビザスクさんのDS特化版と考えるとわかりやすいかもです) • コミュニティ⽀援、を組み込んだ形が特徴 https://nobdata.co.jp/team/ (アドバイザ) (DS組織化中)
  16. Copyright © 2024 NOB DATA All Rights Reserved. DSの裾野の広がりの⼀⽅、専⾨⼈材はまだまだ偏りが⼤きい •

    右の図は2020年頃のDS⼈ 材の求⼈の業種別の分布 • 2024年現在、地域別です とindeedベースでは全体 で22,000件、内訳は東京で 8,000件、⼤阪で900件、 福岡で500件、広島・沖縄 で200件、くらいな状況で す • 特に東京の中堅企業や地⽅ の⼤⼿企業では「データサ イエンティスト」の専⾨職 種が不在なことも多いため、 ノウハウの提供は1つ重要 だと考えています 参考︓https://www.fnn.jp/articles/-/56285 DSの裾野の広がり (⼀種の最前線)
  17. Copyright © 2024 NOB DATA All Rights Reserved. DSの裾野の広がりの⼀⽅、解くべき課題の幅も広がっている •

    地⽅でこれからDS組織 を、という場合、必ず しも「⾼度化」が重要 なわけではないです • 個⼈的にはDS組織を作 るには「IT化」及び 「経営陣をいかに説得 するか」のスキルは重 要だと思ってます ( コンサルスキル ) • 担当者のマインドセッ ト周りの理解、も東京 ベースでは読み違える ことが多いです IT : システム化 (5年) PCがあるか / メールアドレスがあるか / 社⽤スマホがあるか / LINE works等があるか / 情シスがいるか、etc.. データ基盤・DSチーム( 5〜10年 ) データ基盤はあるか / データ運⽤チームはいるか / デー タアナリストはいるか / DS⼈材はいるか / 専⾨職制度が あるか / 経験者がいるか / 社内意思決定に関与できるか、 etc.. AIチーム( 3年〜5年 ) 専⾨⼈材がいるか / ビジネスとの接続がで きるか / 内製化するだけの費⽤対効果が出 るか / 定着するか / 中途採⽤できるか / 社 内からのAIへのアレルギーは出ないか、etc..
  18. Copyright © 2024 NOB DATA All Rights Reserved. スポットコンサルによる「ノウハウの循環」 •

    データ分析組織の⽴ち上げ期 はDSの有識者が不在な事も 多く、試⾏錯誤が続きます。 そこを解決します。 • 10年選⼿・著者クラスのアド バイザーが1時間のスポット コンサルに⼊ることで、よく ある失敗の罠を回避し、分析 組織の定着を⽀援します • また、⼀⼈のアドバイザーに 固定されないため、各専⾨領 域の意⾒を必要なタイミング でもらう事が可能です https://nobdata.co.jp/team/ (アドバイザ)
  19. Copyright © 2024 NOB DATA All Rights Reserved. DS黎明期:2010-2017年ごろまで •

    元々、地⽅にはDSのコミュニティ はあまり多くはなかったのですが、 それでも例えばR⾔語のコミュニ ティであれば10年前(2014年頃)は 札幌、仙台、東京、⼤阪、広島、福 岡などさまざまな場所で開催されて いました (地⽅は主に⼤学の先⽣主 催など。その後Pythonコミュニ ティも広がる) • その場に学⽣もLT(ライトニング トーク)で乗り込み、そこから採⽤ 活動や次期運営メンバーになる、と いう良いサイクルが回っていまし た。 ( 企業も、勉強会会場・懇親会費⽤ を提供する、というような事も多々 ありました )
  20. Copyright © 2024 NOB DATA All Rights Reserved. DS系コミュニティのリアル接点の縮⼩への⼤きな懸念 •

    ⼀⽅で、2019年の新型コロナのパンデミック以来、「リアルでの勉強会」がかな り激減してしまいました。(オンライン化のメリットもある⼀⽅で、弊害も。) • ちなみに最近、福岡や広島、滋賀などでのDS系の学⽣の話を聞くと「そもそも 就職活動するまで地元にはDSの選択肢がないことを知らなかった」「Tokyo.R などの東京の⺠間コミュニティがある事も知らなかった」という状況を観測して まして、かなりこれはまずいな、と思ったのがコミュニティ⽀援に関する動機で す
  21. Copyright © 2024 NOB DATA All Rights Reserved. 参考:これだけ減ったリアル開催(福岡、connpassより) 2019年10⽉

    12⽇間で25件 https://connpass.com/calendar/ 2020年10⽉ 12⽇間で4件 2024年10⽉ 12⽇間で14件
  22. Copyright © 2024 NOB DATA All Rights Reserved. リアルで開催しようにも、会場確保の問題が⼤きい •

    会議室を20名〜50名規模で確保しようとすると数万円はかかりますが、流⽯に学 ⽣さんや社会⼈とは⾔えポケットマネーで出すのは厳しいと思います。これらを応 援団では⽀援予定です。( 会場費、懇親会費、また講師派遣する場合の旅費交通費 等。逆に、学⽣さんを東京に呼ぶ場合の費⽤に当てても良いかもです ) • また「リアルの勉強会」を⽴ち上げたことのある知り合いもおそらく少なくなって いると思いますので、そのようなエリアでは「⽴ち上げ⽅のアドバイス」も必要に なるかもしれません • このエリアでDSコミュニティを⽴ち上げたい!またはお世話になった地元のコ ミュニティを⽀援したい!という熱い思いをお持ちの皆様、ぜひお声がけください。 売り上げの 50%は アドバイザー へ 売り上げの 25%は 運営へ 売り上げの 25%は コミュニティ ⽀援へ ※数字は⽬安
  23. Copyright © 2024 NOB DATA All Rights Reserved. アドバイザー側のメリットについて •

    本業において副業がOKという前提にはなりますが、新たな外部の知⾒獲得、副 業収⼊の獲得、また「アドバイザー同⼠の繋がり」の確保、「⽀援したいコ ミュニティとの繋がりの確保」などがメリットとして挙げられます。 • 収⼊に関してはスポットコンサルの場合、1時間単価で⾒ると50%の分配率でも そこそこコスパは良いかなと思います。 ( 10万で受けた場合、5万円の報酬。2.5万を運営、2.5万をコミュニティへ ) • またある程度の副収⼊があれば⽉1どこか好きな場所に⾶んだり、また場合に よっては「福岡と東京」の2拠点での活動も可能になるかもしれません • 将来地元で独⽴するケースも視野に⼊れている場合、DSのキャリアの選択肢を 広げる意味でもアドバイザー側での参画は学びが多いかと思います。
  24. Copyright © 2024 NOB DATA All Rights Reserved. 余談:個⼈的には3つの輪 x

    「影響⼒」のプラスワン • 午前中のスキル定義委員会のセッションでもありましたが、DSのスキルセット の3つの輪、に掛け合わせるなら個⼈的には「影響⼒」かなと思ってます ビジネス⼒ データ サイエンス⼒ データ エンジニア リング⼒ + 影響⼒ • 社内成果 • データ理解 • 業務理解 • ⼈脈 • コミュニティ • 仲間 • LT/登壇 • 書籍/論⽂執筆 • 副業/起業 • ⽀援/投資 • etc..
  25. Copyright © 2024 NOB DATA All Rights Reserved. 結びに:10年後に東京以外の地元でもデータサイエンスできる世界を⽬指して •

    現時点では、ごく⼀部の企業を除いて本格的にデータサイエンティストとしてビジネス経験 を積もうと思った場合、まず東京での就職を⽬指すことになります • ⼀⽅で、東京で修⾏を終えた後に、地元や好きな場所でその腕を振るえる環境を構築するた めにも、企業、アドバイザー、コミュニティの3⽅よしが実現できれば、と思っておりま す。 • ちなみに個⼈的にはDSでもAGIでもさらに先の未来技術でも、技術は変われども気の合う仲 間の皆さんとワイワイ出来れば良いなと思っております。ひとまずは各種・各地のコミュニ ティでデータサイエンスを肴に、⼀緒に飲みたいですね。 • もしご興味をお持ちの⽅はNOB DATAの⼤城までお気軽にお声がけください・・!
  26. Copyright © 2024 NOB DATA All Rights Reserved. Enjoy Data

    Science ..!! 何か個別のご相談やご質問がございましたら [email protected] (NOB DATA問い合わせ窓⼝) までお気軽にどうぞ。