$30 off During Our Annual Pro Sale. View Details »

20231112_ChatGPTの活用によるデータサイエンス人材の育成

NobuakiOshiro
November 12, 2023

 20231112_ChatGPTの活用によるデータサイエンス人材の育成

NobuakiOshiro

November 12, 2023
Tweet

More Decks by NobuakiOshiro

Other Decks in Technology

Transcript

  1. ChatGPTの活⽤による
    データサイエンス⼈材の育成
    2023/11/12
    NOB DATA株式会社
    代表取締役 ⼤城 信晃

    View Slide

  2. Copyright © 2023 NOB DATA All Rights Reserved.
    簡単なアンケート
    Q : ChatGPTを使ったことがありますか?
    0 : 初めて触る or
    ⽉に1-2回程度
    1: 無料版を週1は
    使ってる
    (ChatGPT-3.5)
    2: 有料版を契約して
    使ってる
    (ChatGPT-4)

    View Slide

  3. Copyright © 2023 NOB DATA All Rights Reserved.
    本⽇の流れ
    以下、60分程度をデモを交えつつ実施予定です (その後、質疑応答を20分ほど)
    • ⾃⼰紹介とChatGPT活⽤のモチベーション
    • ChatGPTの基礎振り返り
    • データサイエンスの教育や実務へのCahtGPT活⽤
    • 個⼈的な未来予想

    View Slide

  4. Copyright © 2023 NOB DATA All Rights Reserved.
    ⾃⼰紹介とChatGPT活⽤のモチベーション

    View Slide

  5. Copyright © 2023 NOB DATA All Rights Reserved.
    ⾃⼰紹介
    ⼤城信晃(twitter @doradora09)
    NOB DATA株式会社 代表取締役社⻑ /
    データサイエンティスト協会九州⽀部 ⽀部⻑
    ・住まい
    沖縄 -> 東京 -> 福岡
    ・職歴
    ヤフー-> DATUM STUDIO ->
    LINE Fukuoka -> NOB DATA(株) 創業
    ・運営コミュニティ
    ・Tokyo.R(2010-2016)
    ・fukuoka.R、PyData.Fukuoka、
    オモシロAIごった煮勉強会、ChatGPT部、
    他2つ
    2022/12/5からChatGPTは利⽤
    (利⽤から11ヶ⽉くらい)

    View Slide

  6. Copyright © 2023 NOB DATA All Rights Reserved.
    R⾔語コミュニティの運営(Tokyo.R, fukuoka.R)

    View Slide

  7. Copyright © 2023 NOB DATA All Rights Reserved.
    企業紹介
    企業情報
    • 社名 ︓NOB DATA株式会社
    • 設⽴年⽉⽇ ︓2018年9⽉
    • 代表取締役 ︓⼤城信晃
    • 所在地 ︓〒812-0013 福岡市博多区博多駅東2-5-19 サンライフ 第3ビル 6F
    • 事業内容 ︓データ活⽤に関するコンサルティング、受託分析、⼈材育成、セミナー、執筆など
    • Webサイト : https://nobdata.co.jp/
    ü リモート&副業を中⼼としたのべ30名程のメンバーにて、AI・データ分析プロジェクトの
    プロフェッショナル集団として⽇本企業のDXの推進⽀援を⾏っております
    ü 全国どこでも、ビッグデータやAI技術の恩恵に預かれる環境づくりを⽬指しています

    View Slide

  8. Copyright © 2023 NOB DATA All Rights Reserved.
    DS協会の活動 九州⽀部
    九州エリアにデータサイエンティストを
    増やすべく活動中

    View Slide

  9. Copyright © 2023 NOB DATA All Rights Reserved.
    2023/6/14-16の3⽇間は幕張メッセの展⽰会に出展

    View Slide

  10. Copyright © 2023 NOB DATA All Rights Reserved.
    企業でのデータ分析が本業の私がなぜ
    この1年弱、ChatGPTをウォッチしているのか?

    View Slide

  11. Copyright © 2023 NOB DATA All Rights Reserved.
    2022/3/14の衝撃 (GPT-4登場と⾔語処理学会) (1/2)
    https://twitter.com/anlpmeeting/status/1646717419153661953

    View Slide

  12. Copyright © 2023 NOB DATA All Rights Reserved.
    2022/3/14の衝撃 (GPT-4登場と⾔語処理学会) (2/2)
    研究者の先⽣⽅も
    「何が起きているのかわからない」
    という衝撃
    ChatGPTに関する情報や活⽤⽅法について情報収集
    ( 主にユーザーとして )

    View Slide

  13. Copyright © 2023 NOB DATA All Rights Reserved.
    参考:検索クエリ(ヤフー DS.INSIGHTより)
    • 4/11が「chatgpt」「チャットgpt」検索数のピーク

    View Slide

  14. Copyright © 2023 NOB DATA All Rights Reserved.
    4/10のサムアルトマン来⽇が報じられたのが4/11
    • ただし、現時点では結局この提案は実現していない (⾮常に残念)
    引⽤元
    https://twitter.com/AkihisaShiozaki/status/1645320688746762242

    View Slide

  15. Copyright © 2023 NOB DATA All Rights Reserved.
    現時点での所感
    • 思ったより、⽇本では普及していない
    • ⽇本語、英語の性能差 (プログラミング⾔語ユーザーは利⽤率⾼)
    • $20の壁 (GPT-4を触ったことがあるかどうか)
    • 直近数年はおそらく⼤丈夫だが、⿊船が来る可能性も
    • 知的労働分野
    • ⾔語の壁や⽂化の壁はChatGPTである程度カバーできる可能性
    ( ⾳声対話もここ1ヶ⽉で実装済み )
    • ⼀⽅で、ユーザーとして教育やDXへの活⽤といった
    ポテンシャルは⼗分ある
    => ChatGPTを活⽤したDS教育と⾔う観点で本⽇はお話

    View Slide

  16. Copyright © 2023 NOB DATA All Rights Reserved.
    ChatGPTの基礎振り返り

    View Slide

  17. Copyright © 2023 NOB DATA All Rights Reserved.
    ChatGPTとは
    • OpenAI社が開発した⼤規模⾔語モデル
    (LLM) と呼ばれるAI
    https://openai.com/blog/chatgpt
    • 無料版(GPT-3.5)と有料版(GPT-4)、あと
    APIがある
    • 2022年11⽉末にリリースされ、わずか
    2ヶ⽉で1億ユーザーを獲得する今⼀番
    ホットなサービス

    View Slide

  18. Copyright © 2023 NOB DATA All Rights Reserved.
    本家本元のOpenAI社のChatGPTをまず使うべし
    • 様々な企業から「xxGPT」という名称で類似サービスが出ていますが、
    OpenAI社の公式ChatGPTをまず使うのが1番の近道です
    • 「ChatGPT」で検索すると以下の画⾯が出ます
    こちらが公式
    (英語サイトのみ)

    View Slide

  19. Copyright © 2023 NOB DATA All Rights Reserved.
    公式サイトの画⾯
    ⼊り⼝

    View Slide

  20. Copyright © 2023 NOB DATA All Rights Reserved.
    ChatGPTの利⽤画⾯ (旧IF, 2023/11/7以前)
    • 初回はユーザー登録が必
    要です(無料登録可能)
    • その後、ログインすると
    以下のような画⾯が出ま

    (私は有料版を使っている
    ので、GPT-3.5に加えて
    GPT-4も使える状態)
    • なお、こちらは旧IFの画
    ⾯となります
    (順次update)
    ここに依頼事項(プロンプト)を⼊⼒して
    ChatGPTと対話する

    View Slide

  21. Copyright © 2023 NOB DATA All Rights Reserved.
    追記:ChatGPTの利⽤画⾯ (新IF, 2023/11/7以降順次)
    • ⽇本時間11/7のOpenAI
    社のDevDay以降、UIが
    変更となりました
    • ⼤きな変更点の1つとし
    てGPT-4のデフォルトの
    機能に画像⽣成、検索、
    分析の機能が統合されて
    います
    • なお本資料では旧IFを
    ベースとした解説となり
    ますのであらかじめご了
    承ください
    機能が統合された

    View Slide

  22. Copyright © 2023 NOB DATA All Rights Reserved.
    何ができるのか?:対話と難易度調整
    • まず、従来のチャットbotのように、基本的な対話が可能
    (ChatGPTについて教えて下さい、など)

    View Slide

  23. Copyright © 2023 NOB DATA All Rights Reserved.
    何ができるのか?:対話と難易度調整
    • 例えば「⼩学4年⽣にも分かるように」と指⽰することも可能
    (難しい表現がなくなる)

    View Slide

  24. Copyright © 2023 NOB DATA All Rights Reserved.
    何ができるのか?:要約
    • 記事の要約もできる
    • 例えば以下のNEWS
    (修正前は2400字程度)
    • 岸⽥⾸相「チャット
    GPT」アルトマンCEO
    と⾯会 学習へ悪影響
    懸念の声もある中 萱
    野⽒「”禁⽌ではなく
    活⽤”模索が重要」
    • https://news.yahoo.
    co.jp/articles/8a6df
    ecf0dfc9b46adf3732
    b0c2034118760aee4

    View Slide

  25. Copyright © 2023 NOB DATA All Rights Reserved.
    何ができるのか?:要約
    ChatGPTで要約を実施

    View Slide

  26. Copyright © 2023 NOB DATA All Rights Reserved.
    何ができるのか?:ロールプレイや創作
    • ロールプレイや創作も可能
    • 例えばIT企業における⾯接官と新卒の学⽣のやりとりをロールプレイ
    ■依頼事項
    以下の設定でロールプレイして
    ください
    ■設定
    IT企業における⾯接官と新卒の
    学⽣のやりとりをロールプレイ

    View Slide

  27. Copyright © 2023 NOB DATA All Rights Reserved.
    何ができるのか?:メンター・先輩社員の代わり
    • ChatGPTを先輩社員としていろいろ相談する例
    • ここではITエンジニアの先輩としての役割

    View Slide

  28. Copyright © 2023 NOB DATA All Rights Reserved.
    以下、応⽤的な使い⽅の参考

    View Slide

  29. Copyright © 2023 NOB DATA All Rights Reserved.
    何ができるのか?:プログラミング
    • ⾃然⾔語、だけでなくプログ
    ラミング⾔語にも対応
    • FizzBuzz問題なども解ける
    (3の倍数だとfizz、5の倍数
    だとbuzzで答える)

    View Slide

  30. Copyright © 2023 NOB DATA All Rights Reserved.
    何ができるのか?:データ分析や考察
    • データを渡して考察、
    というのもすぐできる
    (ただし、計算はまだ苦⼿)
    • 例えば右は⼈⼝分布のデー
    タを与えて考察してもらっ
    た例
    • 0歳から100歳以上まで、
    1歳区切りのデータ
    データソース:https://www.stat.go.jp/data/jinsui/2021np/index.html

    View Slide

  31. Copyright © 2023 NOB DATA All Rights Reserved.
    何ができるのか?:データ分析や考察
    データソース:https://www.stat.go.jp/data/jinsui/2021np/index.html

    View Slide

  32. Copyright © 2023 NOB DATA All Rights Reserved.
    他にも、アイディア次第で多くのことが依頼できる
    • 補助⾦申請の⽀援、業務⽇報の整理など、アイディア次第で様々なタスクが実施可能

    View Slide

  33. Copyright © 2023 NOB DATA All Rights Reserved.
    利⽤している感覚としては
    「あたかも画⾯の向こうに⼈がいる」
    かのような使⽤感

    View Slide

  34. Copyright © 2023 NOB DATA All Rights Reserved.
    結局、何がすごいのか
    • インターネット
    -> 「記憶」の外部化 (キーワードさえあれば検索すればOK)
    • ChatGPT
    -> 「思考」の外部化 (ただし、問う⼒が重要)
    (使いこなせる⼈は)
    思考タスクを10倍、20倍にするポテンシャルがある

    View Slide

  35. Copyright © 2023 NOB DATA All Rights Reserved.
    ChatGPT活⽤上の注意点と対策

    View Slide

  36. Copyright © 2023 NOB DATA All Rights Reserved.
    ChatGPT活⽤の注意点3つ
    情報漏洩に気をつける
    • ChatGPTの無料版は学習データに使われる可能性があるため、個⼈情報や秘密の情報などは投稿しないように
    気を付けてください
    ChatGPTのウソに騙されない
    • ChatGPTは確率的に⽂章を作成しているため、たまに間違った回答もします(not 検索エンジン)
    • 結果を鵜呑みにするのではなく、批判的思考、またエビデンスを⾃分で探すなどの検証能⼒が重要になります
    情報が古い事に留意する
    • ChatGPTは2022年1⽉(※1)までのデータを基に学習をしているため、それ以降のNEWSについては疎いです
    • ただし、後述するChatGPT-4のプラグインを使えば検索も可能となります
    (※1) . .2023/11/7現在のGPT-3.5。随時変わります。
    なお11/7のupdatedでGPT-4は23年4⽉までの情報を保持している

    View Slide

  37. Copyright © 2023 NOB DATA All Rights Reserved.
    ご参考:プライベートモードへの切り替え(1/2)
    • ブラウザ版のChatGPTを使っていると、将来そのやりとりが学習されてしまう
    可能性があります(情報漏洩のリスク)
    • プライベートモードへの切り替えで学習への利⽤を拒否することができます
    ここをOFFにすると
    プライベートモードになる

    View Slide

  38. Copyright © 2023 NOB DATA All Rights Reserved.
    ご参考:プライベートモードへの切り替え(2/2)
    • ブラウザ版のChatGPTを使っていると、将来そのやりとりが学習されてしまう
    可能性があります(情報漏洩のリスク)
    • プライベートモードへの切り替えで学習への利⽤を拒否することができます
    通常モード プライベート
    モード

    View Slide

  39. Copyright © 2023 NOB DATA All Rights Reserved.
    ChatGPT Plusで広がる世界

    View Slide

  40. Copyright © 2023 NOB DATA All Rights Reserved.
    機能拡張 & マルチモーダル化したChatGPT
    無料版のChatGPTは対話のみですが、
    有料版のChatGPT Plusは下記の機能を備えています( 詳細は割愛 )
    画像認識 / 画像⽣成
    ⾳声認識 / ⾳声出⼒
    (アプリ版)
    プラグイン
    検索 コード実⾏
    11/6発表の
    追加機能

    View Slide

  41. Copyright © 2023 NOB DATA All Rights Reserved.
    プラグインで外部サービス連携 (データ分析&可視化)
    ・Noteableプラグイン、がかなり強⼒。プログラムを外部で実⾏可能
    ・データ分析の依頼やモデル構築、データ可視化なども可能
    => 次のパートではこの辺りを深掘り
    https://app.noteable.io/f/a48e1977-3e15-4754-bd46-
    ed65ec0227dc/Decision_Tree_Demo.ipynb

    View Slide

  42. Copyright © 2023 NOB DATA All Rights Reserved.
    10⽉に公開された画像解析機能もポテンシャル⼤
    MSさんの論⽂p106
    より機械翻訳
    ⾃動⾞の保険レポー
    トの⾃動⽣成
    参考:https://arxiv.org/abs/2309.17421

    View Slide

  43. Copyright © 2023 NOB DATA All Rights Reserved.
    ⾳声対話機能
    ・アプリ版(iOS, Android)
    のChatGPT-4では⾳声⼊
    ⼒・⾳声出⼒が可能です
    ・例えば、「私が話す内容
    を英語に翻訳してくださ
    い」などが指⽰⼀つで実現
    可能です
    ここをクリック
    テキストモード ⾳声モード

    View Slide

  44. Copyright © 2023 NOB DATA All Rights Reserved.
    データサイエンスの教育や実務への
    ChatGPT活⽤

    View Slide

  45. Copyright © 2023 NOB DATA All Rights Reserved.
    データ分析タスクを
    ChatGPTに解いてもらう①
    (交通事故データの可視化)

    View Slide

  46. Copyright © 2023 NOB DATA All Rights Reserved.
    1. データの可視化 (1/4)
    • 交通事故の可視化の例 (Pythonのforeumライブラリを利⽤)
    https://note.com/chatgpt_nobdata/n/n2c0f526bd252

    View Slide

  47. Copyright © 2023 NOB DATA All Rights Reserved.
    データ可視化を依頼 (2/4)
    • データをURLから取得させる⽅法(Noteable & WebPilotプラグインを利⽤)
    ■依頼事項
    noteableプラグインを使って、福岡県の交通
    事故のデータの可視化をお願いします。ライ
    ブラリはleafletを利⽤し、クラスター表⽰して
    ください。
    ■データセット
    https://ckan.open-
    governmentdata.org/dataset/572a4d15-
    5f63-4c51-b717-73deb6d04aaa
    Noteableプラグインで
    ⾃動コーディング

    View Slide

  48. Copyright © 2023 NOB DATA All Rights Reserved.
    データ可視化を依頼 (3/4)
    • ChatGPT-4が試⾏錯誤しながらプログラミングを実⾏

    View Slide

  49. Copyright © 2023 NOB DATA All Rights Reserved.
    データ可視化を依頼 (4/4)
    • ⽇本語で依頼するだけでこのレベルの可視化はほぼ全⾃動で可能

    View Slide

  50. Copyright © 2023 NOB DATA All Rights Reserved.
    データ分析タスクを
    ChatGPTに解いてもらう②
    (タイタニック号の⽣存予測)

    View Slide

  51. Copyright © 2023 NOB DATA All Rights Reserved.
    ChatGPTのデータサイエンス関連の知識の収集元
    ChatGPTはWeb上の多くの
    情報をもとに学習を⾏ってい
    ます
    例えば、機械学習コンペで有
    名なKaggleについてもその対
    象となっています
    ChatGPTをメンターとして、
    機械学習タスクの⼿順を例⽰
    してもらうことも可能です

    View Slide

  52. Copyright © 2023 NOB DATA All Rights Reserved.
    ChatGPTのコード実⾏環境2つ
    ChatGPT Plusには
    「Advanced Data
    Analytics」(旧Code
    Interpreter) というPython
    のプログラムを実⾏できる環
    境があります
    (ただし、pip installは不可)
    また、Noteableプラグイン
    を使うと外部ライブラリの
    pip installやR⾔語の利⽤も
    可能です

    View Slide

  53. Copyright © 2023 NOB DATA All Rights Reserved.
    Kaggleのタイタニック問題について(1/n)
    Kaggleのタイタニックの問題
    について知っているかと⾔う
    質問はYES

    View Slide

  54. Copyright © 2023 NOB DATA All Rights Reserved.
    Kaggleのタイタニック問題について(2/n)
    実験として、本家本元のサイ
    トからトレーニング⽤のデー
    タをダウンロード
    それをChatGPTにアップ
    ロードして⽣存予測モデルの
    構築を依頼
    https://www.kaggle.com/competitions/titanic/data

    View Slide

  55. Copyright © 2023 NOB DATA All Rights Reserved.
    Kaggleのタイタニック問題について(3/n)
    「予測モデルを構築」「精度
    評価」「混同⾏列の表⽰」
    「特徴量重要度の表⽰」など
    を⽇本語で依頼するだけで、
    ⾃動コーディング

    View Slide

  56. Copyright © 2023 NOB DATA All Rights Reserved.
    Kaggleのタイタニック問題について(4/n)
    決定⽊モデルを可視化した場
    合のイメージ ⼥性 or 男性
    ⼥性の場合 男性の場合
    年齢分岐
    6.5歳以上
    6.5歳以下
    客室の等級
    1, 2等客室 3等客室
    373名⾮⽣存
    72名⽣存
    5名⾮⽣存
    125名⽣存
    444名⾮⽣存
    268名⽣存
    59名⾮⽣存
    56名⽣存
    7名⾮⽣存
    15名⽣存
    380名⾮⽣存
    87名⽣存
    64名⾮⽣存
    181名⽣存

    View Slide

  57. Copyright © 2023 NOB DATA All Rights Reserved.
    Kaggleのタイタニック問題について(5/n)
    特徴量重要度を可視化
    (モデルはランダムフォレスト)

    View Slide

  58. Copyright © 2023 NOB DATA All Rights Reserved.
    Kaggleのタイタニック問題について(5/n)
    Noteableプラグインを使え
    ばLightGBMやSHAPなどpip
    installが必要なライブラリも
    利⽤可能

    View Slide

  59. Copyright © 2023 NOB DATA All Rights Reserved.
    Kaggleのタイタニック問題について(6/n)
    前述のウォーターフォールプ
    ロットのOutputの読み⽅の
    質問

    View Slide

  60. Copyright © 2023 NOB DATA All Rights Reserved.
    Kaggleのタイタニック問題について(7/n)
    考察の依頼

    View Slide

  61. Copyright © 2023 NOB DATA All Rights Reserved.
    Kaggleのタイタニック問題について(8/n)
    気になる特徴量に関して、
    深掘りの議論を展開
    また必要に応じて、その観点
    でのEDAの依頼、データの可
    視化・考察などを⼀緒にすす
    めることも可能

    View Slide

  62. Copyright © 2023 NOB DATA All Rights Reserved.
    おまけ:
    データサイエンスプロジェクトの
    ロールプレイ

    View Slide

  63. Copyright © 2023 NOB DATA All Rights Reserved.
    プロジェクトを選択式でロールプレイ
    ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ
    エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)
    https://chat.openai.com/share/404328f7-5b24-489c-
    a258-b3842b90dfcb

    View Slide

  64. Copyright © 2023 NOB DATA All Rights Reserved.
    プロジェクトを選択式でロールプレイ
    ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ
    エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)

    View Slide

  65. Copyright © 2023 NOB DATA All Rights Reserved.
    プロジェクトを選択式でロールプレイ
    ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ
    エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)

    View Slide

  66. Copyright © 2023 NOB DATA All Rights Reserved.
    プロジェクトを選択式でロールプレイ
    ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ
    エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)

    View Slide

  67. Copyright © 2023 NOB DATA All Rights Reserved.
    プロジェクトを選択式でロールプレイ
    ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ
    エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)

    View Slide

  68. Copyright © 2023 NOB DATA All Rights Reserved.
    プロジェクトを選択式でロールプレイ
    ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ
    エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)

    View Slide

  69. Copyright © 2023 NOB DATA All Rights Reserved.
    プロジェクトを選択式でロールプレイ
    ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ
    エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)
    https://chat.openai.com/share/404328f7-5b24-489c-
    a258-b3842b90dfcb

    View Slide

  70. Copyright © 2023 NOB DATA All Rights Reserved.
    応⽤:ここまでの流れを架空データを作ってデモ
    「ここまでの結果をサマリしてください」とすることで、他のセッションに内容
    を概要レベルで引き継ぐことが可能。その上で、データを⽤いたデモを依頼。
    https://chat.openai.com/share/70a80347-7a3e-487f-
    8f0b-b94d54255e3e

    View Slide

  71. Copyright © 2023 NOB DATA All Rights Reserved.
    補⾜:分析だけがデータサイエンティストの仕事ではない
    データが⼿元にあり、モデルを
    作ったり可視化をするのは当然仕
    事ですが、「ステークホルダーと
    の調整」「仮説の構築」「分析後
    のアクションの提⽰」などが企業
    で働くデータサイエンティストに
    は求められます
    ⼀番良いのは先輩社員に相談した
    り、コミュニティで⽣の現場の仕
    事の話を聞くことですが、難しい
    場合は書籍やChatGPTを⽤いた
    ロールプレイなどで想像の範囲を
    広げてみるのも良いのではと思い
    ます。
    https://www.amazon.co.jp/dp/4297117584

    View Slide

  72. Copyright © 2023 NOB DATA All Rights Reserved.
    補⾜:プロジェクトの⼀連の流れで不明な部分はChatGPTにも相談

    View Slide

  73. Copyright © 2023 NOB DATA All Rights Reserved.
    ご紹介: ChatGPT部 (部活動)

    View Slide

  74. Copyright © 2023 NOB DATA All Rights Reserved.
    ChatGPT部、と⾔う部活動
    • 毎週⼟曜⽇の午前10-11時に有志によるオンライン勉強会 (160名程度、常連は20名)
    • 活動内容のレポートをnoteに記載
    • うち、ChatGPTを活⽤して勉強をしている事例を2つご紹介
    https://chatgptclub.connpass.com/ https://note.com/chatgpt_nobdata/

    View Slide

  75. Copyright © 2023 NOB DATA All Rights Reserved.
    ⽇本経済⼤学の原⽥さん・Python学習 x ChatGPT
    • ChatGPTにカリキュラムを作成させ、問題作成、採点をシリーズで実施
    • ⾃⾝のPython学習にChatGPTを活⽤ ( ⾃分で指⽰して教材を作る時代がくるとは・・ )
    https://note.com/chatgpt_nobdata/n/n63d730f93f44

    View Slide

  76. Copyright © 2023 NOB DATA All Rights Reserved.
    ⽇本経済⼤学の原⽥さん・Python学習 x ChatGPT
    • 問題作成しかり、採点しかり
    https://note.com/chatgpt_nobdata/n/ndd3567bacb5f
    https://note.com/chatgpt_nobdata/n/n9d6a1a1d5b20

    View Slide

  77. Copyright © 2023 NOB DATA All Rights Reserved.
    88歳のiOSエンジニア、トミ爺さん
    私が知っている限り、国内では最⾼齢のChatGPTユーザー & iOSアプリエンジニア (10作品リリース)
    ⼩泉勝志郎さん主催のシニアプログラミングネットワーク( https://senior-programming.net/ )に所属。
    60歳を過ぎてからプログラミングを勉強
    https://www.amazon.co.jp/s?i=stripbooks&rh=p_27%3A%E9%88%B4%
    E6%9C%A8%E5%AF%8C%E5%8F%B8&s=relevancerank&text=%E9%88
    %B4%E6%9C%A8%E5%AF%8C%E5%8F%B8&ref=dp_byline_sr_book_1

    View Slide

  78. Copyright © 2023 NOB DATA All Rights Reserved.
    88歳のiOSエンジニア、トミ爺さん
    ChatGPTには「質問番号」を毎回つけて、記録。プログラミングのエラーなどを相談してアプリ開発。
    10/25-27の幕張メッセで⾏われたAI・⼈⼯知能エキスポではビデオにてLT出演

    View Slide

  79. Copyright © 2023 NOB DATA All Rights Reserved.
    88歳のiOSエンジニア、トミ爺さん
    ChatGPTには「質問番号」を毎回つけて、記録。プログラミングのエラーなどを相談してアプリ開発。
    10/25-27の幕張メッセで⾏われたAI・⼈⼯知能エキスポではビデオにてLT出演

    View Slide

  80. Copyright © 2023 NOB DATA All Rights Reserved.
    ChatGPTを活⽤した教育に関しての所感
    • ChatGPT x 教育、はまだ試⾏錯誤が多い分野ですが、「プログラミング」や
    「データ分析」とは⾮常に相性が良いように感じます。
    ( ⼈間とコンピュータやデータの間をChatGPTが取り持ってくれる )
    ( また、その場でコード実⾏することで検証が可能 )
    • 私は普段は社会⼈向けにDXの⽂脈でデータサイエンスやChatGPTの使い⽅を
    レクチャーすることが多いのですが、それ以外にもChatGPT部の活動などを⾒
    ると学⽣から88歳の⽅まで、年齢問わず幅広く扱えるツールだなという印象
    を持っています
    • 少なくとも「聞く相⼿がいなくて⼿が⽌まる」と⾔う状況の回避には⼀役買っ
    てくれている気がします

    View Slide

  81. Copyright © 2023 NOB DATA All Rights Reserved.
    個⼈的な未来予想

    View Slide

  82. Copyright © 2023 NOB DATA All Rights Reserved.
    ご注意
    • 以下のパートは未来予想なので、かなりの不確実性を伴います
    • 後半のパネルディスカッションのネタとして、
    ブレストも兼ねまして話半分(確度50%)くらいで聞いて頂けると幸いです

    View Slide

  83. Copyright © 2023 NOB DATA All Rights Reserved.
    ChatGPTの性能向上
    [ほぼ確実]
    • 現在はChatGPT-4が最新モデルですが、今後GPT-5, 6, 7のようにある程度ま
    ではさらなる性能向上が期待されています(少なくとも、2024年中は進化)
    • ⼀度に扱えるデータ量も11/6のDevDayの発表でGPT-4の32kトークンから128k
    トークン(約6.4万⽂字)まで拡張されました
    • 学習データの鮮度も2022年1⽉から2023年4⽉まで拡張
    [確度中程度]
    • おそらく、学習や対策を重ねるにつれ、現在最⼤の問題であるハルシネー
    ション(幻覚症状)によるウソの出現確率も低減されるものと思われます
    [個⼈的な予想]
    • ⼀⽅で、テキストを中⼼としたWeb上で学習できるコンテンツの量は有限のた
    め、視覚情報や⾳声情報などのマルチモーダルでの学習、と⾔う⽅向性に進ん
    でいるように思われます
    • データ収集タスクの価値が上がる可能性があります(IoTやデータエンジニア等)

    View Slide

  84. Copyright © 2023 NOB DATA All Rights Reserved.
    LLMの軽量化、ロボット接続、エッジ化
    [ほぼ確実]
    • ChatGPTのモデルは何度かチューニングや軽量化が⾏われている節があります
    (いわゆる、重要な部分だけを残した蒸留モデルでダウンサイジング)
    • また画像認識や⾳声認識の機能とロボットを組み合わせると、⾃⽴⾏動可能な
    ロボット型のエージェントがおそらく出てくるものと思われます
    (ゲームやバーチャル空間上ではすでにChatGPTを搭載した⾃⽴型のNPCキャ
    ラクターが登場)
    [確度中程度]
    • OpenAI社関係者⾃⾝も述べているように、いずれはネット接続なしの「ポータ
    ブルなモデル」が実⽤レベルに達する可能性が⾼いです(数年スパン)
    • 最近ではGPUだけでなく、CPUを4bit化することでローカル版LLMが⾼速に動作
    する、というような話も聞こえてきます

    View Slide

  85. Copyright © 2023 NOB DATA All Rights Reserved.
    参考:ロボット視点を想定した画像からの判断
    参考:https://arxiv.org/abs/2309.17421
    • MSさんの論⽂の
    p199を機械翻訳
    • 家庭⽤ロボットの
    視点とした場合、
    キッチンがどこに
    あるか?という問
    いに答えている

    View Slide

  86. Copyright © 2023 NOB DATA All Rights Reserved.
    企業ではMSの躍進、⼀⽅でLLM開発には膨⼤なコスト
    • ChatGPTの登場でどこが儲かったか?と⾔うと間違いなくマイクロソフトさん
    (OpenAI社に対して1兆円規模の投資を実施したと⾔われていますが、7-9⽉の売り
    上げは13%増の8.5兆円、最終利益は27%増の3.4兆円)
    • ⼀⽅で、ChatGPTのようなLLMの開発には学習⽤の環境を整えるだけでも1000億円
    以上かかる、と⾔われているほど⾼コストとなっています
    ( LLMの性能がスケール則に従う間は、いかに資⾦を投下できるかの勝負の側⾯も )
    ( ⼩さなモデルでもファインチューニングを1回回すのに1000万かかる、となると個
    ⼈レベルではどうしようもない・・ )
    • 国内もLINEヤフー・ソフトバンク系列やNTT関係者などが国産LLMに着⼿していま
    すが、資⾦や計算リソースの観点ではMS・OpenAI連合には全く敵わないのでは、と
    思っています。
    (とはいえ、GPT-3.5レベルには近づいていると思います)
    (正⾯からぶつからない⽣き残り戦略も必要。個⼈的には⼈材育成・DX・半導体製造)

    View Slide

  87. Copyright © 2023 NOB DATA All Rights Reserved.
    データサイエンティストはどうすべきか?
    • トップを⽬指す:OpenAI社に誰か⾏って技術習得 (平均年俸1億円との噂)
    • ニッチ領域に特化:⽇本語ならでは、や特定のジャンルに特化
    (ただし、⼈⼝半減に備える必要あり)
    • 守備範囲を広げる:
    例えば狭義の予測モデルのチューニングのタスクから、前後のデータ整備やDevOps
    でのシステム実装。もっと範囲を広げるとプロジェクトのPMとして全体のマネジメ
    ント
    • DXをやる:アナログ->デジタルの部分などはまだまだ⼤量にタスクがあります
    (どちらかというとクラウドエンジニア、インフラエンジニア、BIアナリストが必要)
    • 他の領域に⾏く:3次産業->2次産業->1次産業。
    ChatGPTの影響が少ない分野を探す

    View Slide

  88. Copyright © 2023 NOB DATA All Rights Reserved.
    ビジネス界への影響 : ゴールドマンサックスの予想
    • 3億⼈の仕事をAIが奪い、
    世界のGDPを7%程度引き
    上げるという予測
    • 2019年の世界のGDPが86
    兆ドル程度なので、7%と
    すると6兆ドル(=800兆円
    規模)のインパクト
    引⽤元 : https://gigazine.net/news/20230330-generative-ai-risk/

    View Slide

  89. Copyright © 2023 NOB DATA All Rights Reserved.
    学⽣さんに向けて
    • ChatGPTはある種の「家庭教師」「メンター」としての使い⽅が可能です
    • 「何を⽬指したいか」がある程度明確であれば、そのステップの登り⽅ChatGPTに
    相談して先に進むことができます(ワクワクするテーマ・分野が⾒つかるとベスト)
    • 1社終⾝雇⽤の時代もすでに変わっていますので、まずは1分野である程度の実績
    を積んだのち、シナジーの効く業界にピボットする、というフットワークの軽さが
    あっても良いと思います
    • 変化の激しい時代ですが、テクノロジー的には⾯⽩い時代だと思います。
    ⼀緒に頑張っていきましょう。

    View Slide

  90. Copyright © 2023 NOB DATA All Rights Reserved.
    本⽇の流れ
    以下、60分程度をデモを交えつつ実施予定です (その後、質疑応答を20分ほど)
    • ⾃⼰紹介とChatGPT活⽤のモチベーション
    • ChatGPTの基礎振り返り
    • データサイエンスの教育や実務へのCahtGPT活⽤
    • 個⼈的な未来予想

    View Slide

  91. Copyright © 2023 NOB DATA All Rights Reserved.
    質疑応答

    View Slide

  92. Copyright © 2023 NOB DATA All Rights Reserved.
    ご清聴、ありがとうございました・・!
    何か個別のご相談やご質問がございましたら
    [email protected] (NOB DATA問い合わせ窓⼝)
    までお気軽にどうぞ。

    View Slide