Slide 1

Slide 1 text

ChatGPTの活⽤による データサイエンス⼈材の育成 2023/11/12 NOB DATA株式会社 代表取締役 ⼤城 信晃

Slide 2

Slide 2 text

Copyright © 2023 NOB DATA All Rights Reserved. 簡単なアンケート Q : ChatGPTを使ったことがありますか? 0 : 初めて触る or ⽉に1-2回程度 1: 無料版を週1は 使ってる (ChatGPT-3.5) 2: 有料版を契約して 使ってる (ChatGPT-4)

Slide 3

Slide 3 text

Copyright © 2023 NOB DATA All Rights Reserved. 本⽇の流れ 以下、60分程度をデモを交えつつ実施予定です (その後、質疑応答を20分ほど) • ⾃⼰紹介とChatGPT活⽤のモチベーション • ChatGPTの基礎振り返り • データサイエンスの教育や実務へのCahtGPT活⽤ • 個⼈的な未来予想

Slide 4

Slide 4 text

Copyright © 2023 NOB DATA All Rights Reserved. ⾃⼰紹介とChatGPT活⽤のモチベーション

Slide 5

Slide 5 text

Copyright © 2023 NOB DATA All Rights Reserved. ⾃⼰紹介 ⼤城信晃(twitter @doradora09) NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会九州⽀部 ⽀部⻑ ・住まい 沖縄 -> 東京 -> 福岡 ・職歴 ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業 ・運営コミュニティ ・Tokyo.R(2010-2016) ・fukuoka.R、PyData.Fukuoka、 オモシロAIごった煮勉強会、ChatGPT部、 他2つ 2022/12/5からChatGPTは利⽤ (利⽤から11ヶ⽉くらい)

Slide 6

Slide 6 text

Copyright © 2023 NOB DATA All Rights Reserved. R⾔語コミュニティの運営(Tokyo.R, fukuoka.R)

Slide 7

Slide 7 text

Copyright © 2023 NOB DATA All Rights Reserved. 企業紹介 企業情報 • 社名 ︓NOB DATA株式会社 • 設⽴年⽉⽇ ︓2018年9⽉ • 代表取締役 ︓⼤城信晃 • 所在地 ︓〒812-0013 福岡市博多区博多駅東2-5-19 サンライフ 第3ビル 6F • 事業内容 ︓データ活⽤に関するコンサルティング、受託分析、⼈材育成、セミナー、執筆など • Webサイト : https://nobdata.co.jp/ ü リモート&副業を中⼼としたのべ30名程のメンバーにて、AI・データ分析プロジェクトの プロフェッショナル集団として⽇本企業のDXの推進⽀援を⾏っております ü 全国どこでも、ビッグデータやAI技術の恩恵に預かれる環境づくりを⽬指しています

Slide 8

Slide 8 text

Copyright © 2023 NOB DATA All Rights Reserved. DS協会の活動 九州⽀部 九州エリアにデータサイエンティストを 増やすべく活動中

Slide 9

Slide 9 text

Copyright © 2023 NOB DATA All Rights Reserved. 2023/6/14-16の3⽇間は幕張メッセの展⽰会に出展

Slide 10

Slide 10 text

Copyright © 2023 NOB DATA All Rights Reserved. 企業でのデータ分析が本業の私がなぜ この1年弱、ChatGPTをウォッチしているのか?

Slide 11

Slide 11 text

Copyright © 2023 NOB DATA All Rights Reserved. 2022/3/14の衝撃 (GPT-4登場と⾔語処理学会) (1/2) https://twitter.com/anlpmeeting/status/1646717419153661953

Slide 12

Slide 12 text

Copyright © 2023 NOB DATA All Rights Reserved. 2022/3/14の衝撃 (GPT-4登場と⾔語処理学会) (2/2) 研究者の先⽣⽅も 「何が起きているのかわからない」 という衝撃 ChatGPTに関する情報や活⽤⽅法について情報収集 ( 主にユーザーとして )

Slide 13

Slide 13 text

Copyright © 2023 NOB DATA All Rights Reserved. 参考:検索クエリ(ヤフー DS.INSIGHTより) • 4/11が「chatgpt」「チャットgpt」検索数のピーク

Slide 14

Slide 14 text

Copyright © 2023 NOB DATA All Rights Reserved. 4/10のサムアルトマン来⽇が報じられたのが4/11 • ただし、現時点では結局この提案は実現していない (⾮常に残念) 引⽤元 https://twitter.com/AkihisaShiozaki/status/1645320688746762242

Slide 15

Slide 15 text

Copyright © 2023 NOB DATA All Rights Reserved. 現時点での所感 • 思ったより、⽇本では普及していない • ⽇本語、英語の性能差 (プログラミング⾔語ユーザーは利⽤率⾼) • $20の壁 (GPT-4を触ったことがあるかどうか) • 直近数年はおそらく⼤丈夫だが、⿊船が来る可能性も • 知的労働分野 • ⾔語の壁や⽂化の壁はChatGPTである程度カバーできる可能性 ( ⾳声対話もここ1ヶ⽉で実装済み ) • ⼀⽅で、ユーザーとして教育やDXへの活⽤といった ポテンシャルは⼗分ある => ChatGPTを活⽤したDS教育と⾔う観点で本⽇はお話

Slide 16

Slide 16 text

Copyright © 2023 NOB DATA All Rights Reserved. ChatGPTの基礎振り返り

Slide 17

Slide 17 text

Copyright © 2023 NOB DATA All Rights Reserved. ChatGPTとは • OpenAI社が開発した⼤規模⾔語モデル (LLM) と呼ばれるAI https://openai.com/blog/chatgpt • 無料版(GPT-3.5)と有料版(GPT-4)、あと APIがある • 2022年11⽉末にリリースされ、わずか 2ヶ⽉で1億ユーザーを獲得する今⼀番 ホットなサービス

Slide 18

Slide 18 text

Copyright © 2023 NOB DATA All Rights Reserved. 本家本元のOpenAI社のChatGPTをまず使うべし • 様々な企業から「xxGPT」という名称で類似サービスが出ていますが、 OpenAI社の公式ChatGPTをまず使うのが1番の近道です • 「ChatGPT」で検索すると以下の画⾯が出ます こちらが公式 (英語サイトのみ)

Slide 19

Slide 19 text

Copyright © 2023 NOB DATA All Rights Reserved. 公式サイトの画⾯ ⼊り⼝

Slide 20

Slide 20 text

Copyright © 2023 NOB DATA All Rights Reserved. ChatGPTの利⽤画⾯ (旧IF, 2023/11/7以前) • 初回はユーザー登録が必 要です(無料登録可能) • その後、ログインすると 以下のような画⾯が出ま す (私は有料版を使っている ので、GPT-3.5に加えて GPT-4も使える状態) • なお、こちらは旧IFの画 ⾯となります (順次update) ここに依頼事項(プロンプト)を⼊⼒して ChatGPTと対話する

Slide 21

Slide 21 text

Copyright © 2023 NOB DATA All Rights Reserved. 追記:ChatGPTの利⽤画⾯ (新IF, 2023/11/7以降順次) • ⽇本時間11/7のOpenAI 社のDevDay以降、UIが 変更となりました • ⼤きな変更点の1つとし てGPT-4のデフォルトの 機能に画像⽣成、検索、 分析の機能が統合されて います • なお本資料では旧IFを ベースとした解説となり ますのであらかじめご了 承ください 機能が統合された

Slide 22

Slide 22 text

Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:対話と難易度調整 • まず、従来のチャットbotのように、基本的な対話が可能 (ChatGPTについて教えて下さい、など)

Slide 23

Slide 23 text

Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:対話と難易度調整 • 例えば「⼩学4年⽣にも分かるように」と指⽰することも可能 (難しい表現がなくなる)

Slide 24

Slide 24 text

Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:要約 • 記事の要約もできる • 例えば以下のNEWS (修正前は2400字程度) • 岸⽥⾸相「チャット GPT」アルトマンCEO と⾯会 学習へ悪影響 懸念の声もある中 萱 野⽒「”禁⽌ではなく 活⽤”模索が重要」 • https://news.yahoo. co.jp/articles/8a6df ecf0dfc9b46adf3732 b0c2034118760aee4

Slide 25

Slide 25 text

Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:要約 ChatGPTで要約を実施

Slide 26

Slide 26 text

Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:ロールプレイや創作 • ロールプレイや創作も可能 • 例えばIT企業における⾯接官と新卒の学⽣のやりとりをロールプレイ ■依頼事項 以下の設定でロールプレイして ください ■設定 IT企業における⾯接官と新卒の 学⽣のやりとりをロールプレイ

Slide 27

Slide 27 text

Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:メンター・先輩社員の代わり • ChatGPTを先輩社員としていろいろ相談する例 • ここではITエンジニアの先輩としての役割

Slide 28

Slide 28 text

Copyright © 2023 NOB DATA All Rights Reserved. 以下、応⽤的な使い⽅の参考

Slide 29

Slide 29 text

Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:プログラミング • ⾃然⾔語、だけでなくプログ ラミング⾔語にも対応 • FizzBuzz問題なども解ける (3の倍数だとfizz、5の倍数 だとbuzzで答える)

Slide 30

Slide 30 text

Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:データ分析や考察 • データを渡して考察、 というのもすぐできる (ただし、計算はまだ苦⼿) • 例えば右は⼈⼝分布のデー タを与えて考察してもらっ た例 • 0歳から100歳以上まで、 1歳区切りのデータ データソース:https://www.stat.go.jp/data/jinsui/2021np/index.html

Slide 31

Slide 31 text

Copyright © 2023 NOB DATA All Rights Reserved. 何ができるのか?:データ分析や考察 データソース:https://www.stat.go.jp/data/jinsui/2021np/index.html

Slide 32

Slide 32 text

Copyright © 2023 NOB DATA All Rights Reserved. 他にも、アイディア次第で多くのことが依頼できる • 補助⾦申請の⽀援、業務⽇報の整理など、アイディア次第で様々なタスクが実施可能

Slide 33

Slide 33 text

Copyright © 2023 NOB DATA All Rights Reserved. 利⽤している感覚としては 「あたかも画⾯の向こうに⼈がいる」 かのような使⽤感

Slide 34

Slide 34 text

Copyright © 2023 NOB DATA All Rights Reserved. 結局、何がすごいのか • インターネット -> 「記憶」の外部化 (キーワードさえあれば検索すればOK) • ChatGPT -> 「思考」の外部化 (ただし、問う⼒が重要) (使いこなせる⼈は) 思考タスクを10倍、20倍にするポテンシャルがある

Slide 35

Slide 35 text

Copyright © 2023 NOB DATA All Rights Reserved. ChatGPT活⽤上の注意点と対策

Slide 36

Slide 36 text

Copyright © 2023 NOB DATA All Rights Reserved. ChatGPT活⽤の注意点3つ 情報漏洩に気をつける • ChatGPTの無料版は学習データに使われる可能性があるため、個⼈情報や秘密の情報などは投稿しないように 気を付けてください ChatGPTのウソに騙されない • ChatGPTは確率的に⽂章を作成しているため、たまに間違った回答もします(not 検索エンジン) • 結果を鵜呑みにするのではなく、批判的思考、またエビデンスを⾃分で探すなどの検証能⼒が重要になります 情報が古い事に留意する • ChatGPTは2022年1⽉(※1)までのデータを基に学習をしているため、それ以降のNEWSについては疎いです • ただし、後述するChatGPT-4のプラグインを使えば検索も可能となります (※1) . .2023/11/7現在のGPT-3.5。随時変わります。 なお11/7のupdatedでGPT-4は23年4⽉までの情報を保持している

Slide 37

Slide 37 text

Copyright © 2023 NOB DATA All Rights Reserved. ご参考:プライベートモードへの切り替え(1/2) • ブラウザ版のChatGPTを使っていると、将来そのやりとりが学習されてしまう 可能性があります(情報漏洩のリスク) • プライベートモードへの切り替えで学習への利⽤を拒否することができます ここをOFFにすると プライベートモードになる

Slide 38

Slide 38 text

Copyright © 2023 NOB DATA All Rights Reserved. ご参考:プライベートモードへの切り替え(2/2) • ブラウザ版のChatGPTを使っていると、将来そのやりとりが学習されてしまう 可能性があります(情報漏洩のリスク) • プライベートモードへの切り替えで学習への利⽤を拒否することができます 通常モード プライベート モード

Slide 39

Slide 39 text

Copyright © 2023 NOB DATA All Rights Reserved. ChatGPT Plusで広がる世界

Slide 40

Slide 40 text

Copyright © 2023 NOB DATA All Rights Reserved. 機能拡張 & マルチモーダル化したChatGPT 無料版のChatGPTは対話のみですが、 有料版のChatGPT Plusは下記の機能を備えています( 詳細は割愛 ) 画像認識 / 画像⽣成 ⾳声認識 / ⾳声出⼒ (アプリ版) プラグイン 検索 コード実⾏ 11/6発表の 追加機能

Slide 41

Slide 41 text

Copyright © 2023 NOB DATA All Rights Reserved. プラグインで外部サービス連携 (データ分析&可視化) ・Noteableプラグイン、がかなり強⼒。プログラムを外部で実⾏可能 ・データ分析の依頼やモデル構築、データ可視化なども可能 => 次のパートではこの辺りを深掘り https://app.noteable.io/f/a48e1977-3e15-4754-bd46- ed65ec0227dc/Decision_Tree_Demo.ipynb

Slide 42

Slide 42 text

Copyright © 2023 NOB DATA All Rights Reserved. 10⽉に公開された画像解析機能もポテンシャル⼤ MSさんの論⽂p106 より機械翻訳 ⾃動⾞の保険レポー トの⾃動⽣成 参考:https://arxiv.org/abs/2309.17421

Slide 43

Slide 43 text

Copyright © 2023 NOB DATA All Rights Reserved. ⾳声対話機能 ・アプリ版(iOS, Android) のChatGPT-4では⾳声⼊ ⼒・⾳声出⼒が可能です ・例えば、「私が話す内容 を英語に翻訳してくださ い」などが指⽰⼀つで実現 可能です ここをクリック テキストモード ⾳声モード

Slide 44

Slide 44 text

Copyright © 2023 NOB DATA All Rights Reserved. データサイエンスの教育や実務への ChatGPT活⽤

Slide 45

Slide 45 text

Copyright © 2023 NOB DATA All Rights Reserved. データ分析タスクを ChatGPTに解いてもらう① (交通事故データの可視化)

Slide 46

Slide 46 text

Copyright © 2023 NOB DATA All Rights Reserved. 1. データの可視化 (1/4) • 交通事故の可視化の例 (Pythonのforeumライブラリを利⽤) https://note.com/chatgpt_nobdata/n/n2c0f526bd252

Slide 47

Slide 47 text

Copyright © 2023 NOB DATA All Rights Reserved. データ可視化を依頼 (2/4) • データをURLから取得させる⽅法(Noteable & WebPilotプラグインを利⽤) ■依頼事項 noteableプラグインを使って、福岡県の交通 事故のデータの可視化をお願いします。ライ ブラリはleafletを利⽤し、クラスター表⽰して ください。 ■データセット https://ckan.open- governmentdata.org/dataset/572a4d15- 5f63-4c51-b717-73deb6d04aaa Noteableプラグインで ⾃動コーディング

Slide 48

Slide 48 text

Copyright © 2023 NOB DATA All Rights Reserved. データ可視化を依頼 (3/4) • ChatGPT-4が試⾏錯誤しながらプログラミングを実⾏

Slide 49

Slide 49 text

Copyright © 2023 NOB DATA All Rights Reserved. データ可視化を依頼 (4/4) • ⽇本語で依頼するだけでこのレベルの可視化はほぼ全⾃動で可能

Slide 50

Slide 50 text

Copyright © 2023 NOB DATA All Rights Reserved. データ分析タスクを ChatGPTに解いてもらう② (タイタニック号の⽣存予測)

Slide 51

Slide 51 text

Copyright © 2023 NOB DATA All Rights Reserved. ChatGPTのデータサイエンス関連の知識の収集元 ChatGPTはWeb上の多くの 情報をもとに学習を⾏ってい ます 例えば、機械学習コンペで有 名なKaggleについてもその対 象となっています ChatGPTをメンターとして、 機械学習タスクの⼿順を例⽰ してもらうことも可能です

Slide 52

Slide 52 text

Copyright © 2023 NOB DATA All Rights Reserved. ChatGPTのコード実⾏環境2つ ChatGPT Plusには 「Advanced Data Analytics」(旧Code Interpreter) というPython のプログラムを実⾏できる環 境があります (ただし、pip installは不可) また、Noteableプラグイン を使うと外部ライブラリの pip installやR⾔語の利⽤も 可能です

Slide 53

Slide 53 text

Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(1/n) Kaggleのタイタニックの問題 について知っているかと⾔う 質問はYES

Slide 54

Slide 54 text

Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(2/n) 実験として、本家本元のサイ トからトレーニング⽤のデー タをダウンロード それをChatGPTにアップ ロードして⽣存予測モデルの 構築を依頼 https://www.kaggle.com/competitions/titanic/data

Slide 55

Slide 55 text

Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(3/n) 「予測モデルを構築」「精度 評価」「混同⾏列の表⽰」 「特徴量重要度の表⽰」など を⽇本語で依頼するだけで、 ⾃動コーディング

Slide 56

Slide 56 text

Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(4/n) 決定⽊モデルを可視化した場 合のイメージ ⼥性 or 男性 ⼥性の場合 男性の場合 年齢分岐 6.5歳以上 6.5歳以下 客室の等級 1, 2等客室 3等客室 373名⾮⽣存 72名⽣存 5名⾮⽣存 125名⽣存 444名⾮⽣存 268名⽣存 59名⾮⽣存 56名⽣存 7名⾮⽣存 15名⽣存 380名⾮⽣存 87名⽣存 64名⾮⽣存 181名⽣存

Slide 57

Slide 57 text

Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(5/n) 特徴量重要度を可視化 (モデルはランダムフォレスト)

Slide 58

Slide 58 text

Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(5/n) Noteableプラグインを使え ばLightGBMやSHAPなどpip installが必要なライブラリも 利⽤可能

Slide 59

Slide 59 text

Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(6/n) 前述のウォーターフォールプ ロットのOutputの読み⽅の 質問

Slide 60

Slide 60 text

Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(7/n) 考察の依頼

Slide 61

Slide 61 text

Copyright © 2023 NOB DATA All Rights Reserved. Kaggleのタイタニック問題について(8/n) 気になる特徴量に関して、 深掘りの議論を展開 また必要に応じて、その観点 でのEDAの依頼、データの可 視化・考察などを⼀緒にすす めることも可能

Slide 62

Slide 62 text

Copyright © 2023 NOB DATA All Rights Reserved. おまけ: データサイエンスプロジェクトの ロールプレイ

Slide 63

Slide 63 text

Copyright © 2023 NOB DATA All Rights Reserved. プロジェクトを選択式でロールプレイ ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG) https://chat.openai.com/share/404328f7-5b24-489c- a258-b3842b90dfcb

Slide 64

Slide 64 text

Copyright © 2023 NOB DATA All Rights Reserved. プロジェクトを選択式でロールプレイ ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)

Slide 65

Slide 65 text

Copyright © 2023 NOB DATA All Rights Reserved. プロジェクトを選択式でロールプレイ ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)

Slide 66

Slide 66 text

Copyright © 2023 NOB DATA All Rights Reserved. プロジェクトを選択式でロールプレイ ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)

Slide 67

Slide 67 text

Copyright © 2023 NOB DATA All Rights Reserved. プロジェクトを選択式でロールプレイ ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)

Slide 68

Slide 68 text

Copyright © 2023 NOB DATA All Rights Reserved. プロジェクトを選択式でロールプレイ ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG)

Slide 69

Slide 69 text

Copyright © 2023 NOB DATA All Rights Reserved. プロジェクトを選択式でロールプレイ ChatGPTはロールプレイも可能。例として5ターン制でスコアを競うデータサイ エンスプロジェクトのロールプレイを実施(ひとりテーブルトークRPG) https://chat.openai.com/share/404328f7-5b24-489c- a258-b3842b90dfcb

Slide 70

Slide 70 text

Copyright © 2023 NOB DATA All Rights Reserved. 応⽤:ここまでの流れを架空データを作ってデモ 「ここまでの結果をサマリしてください」とすることで、他のセッションに内容 を概要レベルで引き継ぐことが可能。その上で、データを⽤いたデモを依頼。 https://chat.openai.com/share/70a80347-7a3e-487f- 8f0b-b94d54255e3e

Slide 71

Slide 71 text

Copyright © 2023 NOB DATA All Rights Reserved. 補⾜:分析だけがデータサイエンティストの仕事ではない データが⼿元にあり、モデルを 作ったり可視化をするのは当然仕 事ですが、「ステークホルダーと の調整」「仮説の構築」「分析後 のアクションの提⽰」などが企業 で働くデータサイエンティストに は求められます ⼀番良いのは先輩社員に相談した り、コミュニティで⽣の現場の仕 事の話を聞くことですが、難しい 場合は書籍やChatGPTを⽤いた ロールプレイなどで想像の範囲を 広げてみるのも良いのではと思い ます。 https://www.amazon.co.jp/dp/4297117584

Slide 72

Slide 72 text

Copyright © 2023 NOB DATA All Rights Reserved. 補⾜:プロジェクトの⼀連の流れで不明な部分はChatGPTにも相談

Slide 73

Slide 73 text

Copyright © 2023 NOB DATA All Rights Reserved. ご紹介: ChatGPT部 (部活動)

Slide 74

Slide 74 text

Copyright © 2023 NOB DATA All Rights Reserved. ChatGPT部、と⾔う部活動 • 毎週⼟曜⽇の午前10-11時に有志によるオンライン勉強会 (160名程度、常連は20名) • 活動内容のレポートをnoteに記載 • うち、ChatGPTを活⽤して勉強をしている事例を2つご紹介 https://chatgptclub.connpass.com/ https://note.com/chatgpt_nobdata/

Slide 75

Slide 75 text

Copyright © 2023 NOB DATA All Rights Reserved. ⽇本経済⼤学の原⽥さん・Python学習 x ChatGPT • ChatGPTにカリキュラムを作成させ、問題作成、採点をシリーズで実施 • ⾃⾝のPython学習にChatGPTを活⽤ ( ⾃分で指⽰して教材を作る時代がくるとは・・ ) https://note.com/chatgpt_nobdata/n/n63d730f93f44

Slide 76

Slide 76 text

Copyright © 2023 NOB DATA All Rights Reserved. ⽇本経済⼤学の原⽥さん・Python学習 x ChatGPT • 問題作成しかり、採点しかり https://note.com/chatgpt_nobdata/n/ndd3567bacb5f https://note.com/chatgpt_nobdata/n/n9d6a1a1d5b20

Slide 77

Slide 77 text

Copyright © 2023 NOB DATA All Rights Reserved. 88歳のiOSエンジニア、トミ爺さん 私が知っている限り、国内では最⾼齢のChatGPTユーザー & iOSアプリエンジニア (10作品リリース) ⼩泉勝志郎さん主催のシニアプログラミングネットワーク( https://senior-programming.net/ )に所属。 60歳を過ぎてからプログラミングを勉強 https://www.amazon.co.jp/s?i=stripbooks&rh=p_27%3A%E9%88%B4% E6%9C%A8%E5%AF%8C%E5%8F%B8&s=relevancerank&text=%E9%88 %B4%E6%9C%A8%E5%AF%8C%E5%8F%B8&ref=dp_byline_sr_book_1

Slide 78

Slide 78 text

Copyright © 2023 NOB DATA All Rights Reserved. 88歳のiOSエンジニア、トミ爺さん ChatGPTには「質問番号」を毎回つけて、記録。プログラミングのエラーなどを相談してアプリ開発。 10/25-27の幕張メッセで⾏われたAI・⼈⼯知能エキスポではビデオにてLT出演

Slide 79

Slide 79 text

Copyright © 2023 NOB DATA All Rights Reserved. 88歳のiOSエンジニア、トミ爺さん ChatGPTには「質問番号」を毎回つけて、記録。プログラミングのエラーなどを相談してアプリ開発。 10/25-27の幕張メッセで⾏われたAI・⼈⼯知能エキスポではビデオにてLT出演

Slide 80

Slide 80 text

Copyright © 2023 NOB DATA All Rights Reserved. ChatGPTを活⽤した教育に関しての所感 • ChatGPT x 教育、はまだ試⾏錯誤が多い分野ですが、「プログラミング」や 「データ分析」とは⾮常に相性が良いように感じます。 ( ⼈間とコンピュータやデータの間をChatGPTが取り持ってくれる ) ( また、その場でコード実⾏することで検証が可能 ) • 私は普段は社会⼈向けにDXの⽂脈でデータサイエンスやChatGPTの使い⽅を レクチャーすることが多いのですが、それ以外にもChatGPT部の活動などを⾒ ると学⽣から88歳の⽅まで、年齢問わず幅広く扱えるツールだなという印象 を持っています • 少なくとも「聞く相⼿がいなくて⼿が⽌まる」と⾔う状況の回避には⼀役買っ てくれている気がします

Slide 81

Slide 81 text

Copyright © 2023 NOB DATA All Rights Reserved. 個⼈的な未来予想

Slide 82

Slide 82 text

Copyright © 2023 NOB DATA All Rights Reserved. ご注意 • 以下のパートは未来予想なので、かなりの不確実性を伴います • 後半のパネルディスカッションのネタとして、 ブレストも兼ねまして話半分(確度50%)くらいで聞いて頂けると幸いです

Slide 83

Slide 83 text

Copyright © 2023 NOB DATA All Rights Reserved. ChatGPTの性能向上 [ほぼ確実] • 現在はChatGPT-4が最新モデルですが、今後GPT-5, 6, 7のようにある程度ま ではさらなる性能向上が期待されています(少なくとも、2024年中は進化) • ⼀度に扱えるデータ量も11/6のDevDayの発表でGPT-4の32kトークンから128k トークン(約6.4万⽂字)まで拡張されました • 学習データの鮮度も2022年1⽉から2023年4⽉まで拡張 [確度中程度] • おそらく、学習や対策を重ねるにつれ、現在最⼤の問題であるハルシネー ション(幻覚症状)によるウソの出現確率も低減されるものと思われます [個⼈的な予想] • ⼀⽅で、テキストを中⼼としたWeb上で学習できるコンテンツの量は有限のた め、視覚情報や⾳声情報などのマルチモーダルでの学習、と⾔う⽅向性に進ん でいるように思われます • データ収集タスクの価値が上がる可能性があります(IoTやデータエンジニア等)

Slide 84

Slide 84 text

Copyright © 2023 NOB DATA All Rights Reserved. LLMの軽量化、ロボット接続、エッジ化 [ほぼ確実] • ChatGPTのモデルは何度かチューニングや軽量化が⾏われている節があります (いわゆる、重要な部分だけを残した蒸留モデルでダウンサイジング) • また画像認識や⾳声認識の機能とロボットを組み合わせると、⾃⽴⾏動可能な ロボット型のエージェントがおそらく出てくるものと思われます (ゲームやバーチャル空間上ではすでにChatGPTを搭載した⾃⽴型のNPCキャ ラクターが登場) [確度中程度] • OpenAI社関係者⾃⾝も述べているように、いずれはネット接続なしの「ポータ ブルなモデル」が実⽤レベルに達する可能性が⾼いです(数年スパン) • 最近ではGPUだけでなく、CPUを4bit化することでローカル版LLMが⾼速に動作 する、というような話も聞こえてきます

Slide 85

Slide 85 text

Copyright © 2023 NOB DATA All Rights Reserved. 参考:ロボット視点を想定した画像からの判断 参考:https://arxiv.org/abs/2309.17421 • MSさんの論⽂の p199を機械翻訳 • 家庭⽤ロボットの 視点とした場合、 キッチンがどこに あるか?という問 いに答えている

Slide 86

Slide 86 text

Copyright © 2023 NOB DATA All Rights Reserved. 企業ではMSの躍進、⼀⽅でLLM開発には膨⼤なコスト • ChatGPTの登場でどこが儲かったか?と⾔うと間違いなくマイクロソフトさん (OpenAI社に対して1兆円規模の投資を実施したと⾔われていますが、7-9⽉の売り 上げは13%増の8.5兆円、最終利益は27%増の3.4兆円) • ⼀⽅で、ChatGPTのようなLLMの開発には学習⽤の環境を整えるだけでも1000億円 以上かかる、と⾔われているほど⾼コストとなっています ( LLMの性能がスケール則に従う間は、いかに資⾦を投下できるかの勝負の側⾯も ) ( ⼩さなモデルでもファインチューニングを1回回すのに1000万かかる、となると個 ⼈レベルではどうしようもない・・ ) • 国内もLINEヤフー・ソフトバンク系列やNTT関係者などが国産LLMに着⼿していま すが、資⾦や計算リソースの観点ではMS・OpenAI連合には全く敵わないのでは、と 思っています。 (とはいえ、GPT-3.5レベルには近づいていると思います) (正⾯からぶつからない⽣き残り戦略も必要。個⼈的には⼈材育成・DX・半導体製造)

Slide 87

Slide 87 text

Copyright © 2023 NOB DATA All Rights Reserved. データサイエンティストはどうすべきか? • トップを⽬指す:OpenAI社に誰か⾏って技術習得 (平均年俸1億円との噂) • ニッチ領域に特化:⽇本語ならでは、や特定のジャンルに特化 (ただし、⼈⼝半減に備える必要あり) • 守備範囲を広げる: 例えば狭義の予測モデルのチューニングのタスクから、前後のデータ整備やDevOps でのシステム実装。もっと範囲を広げるとプロジェクトのPMとして全体のマネジメ ント • DXをやる:アナログ->デジタルの部分などはまだまだ⼤量にタスクがあります (どちらかというとクラウドエンジニア、インフラエンジニア、BIアナリストが必要) • 他の領域に⾏く:3次産業->2次産業->1次産業。 ChatGPTの影響が少ない分野を探す

Slide 88

Slide 88 text

Copyright © 2023 NOB DATA All Rights Reserved. ビジネス界への影響 : ゴールドマンサックスの予想 • 3億⼈の仕事をAIが奪い、 世界のGDPを7%程度引き 上げるという予測 • 2019年の世界のGDPが86 兆ドル程度なので、7%と すると6兆ドル(=800兆円 規模)のインパクト 引⽤元 : https://gigazine.net/news/20230330-generative-ai-risk/

Slide 89

Slide 89 text

Copyright © 2023 NOB DATA All Rights Reserved. 学⽣さんに向けて • ChatGPTはある種の「家庭教師」「メンター」としての使い⽅が可能です • 「何を⽬指したいか」がある程度明確であれば、そのステップの登り⽅ChatGPTに 相談して先に進むことができます(ワクワクするテーマ・分野が⾒つかるとベスト) • 1社終⾝雇⽤の時代もすでに変わっていますので、まずは1分野である程度の実績 を積んだのち、シナジーの効く業界にピボットする、というフットワークの軽さが あっても良いと思います • 変化の激しい時代ですが、テクノロジー的には⾯⽩い時代だと思います。 ⼀緒に頑張っていきましょう。

Slide 90

Slide 90 text

Copyright © 2023 NOB DATA All Rights Reserved. 本⽇の流れ 以下、60分程度をデモを交えつつ実施予定です (その後、質疑応答を20分ほど) • ⾃⼰紹介とChatGPT活⽤のモチベーション • ChatGPTの基礎振り返り • データサイエンスの教育や実務へのCahtGPT活⽤ • 個⼈的な未来予想

Slide 91

Slide 91 text

Copyright © 2023 NOB DATA All Rights Reserved. 質疑応答

Slide 92

Slide 92 text

Copyright © 2023 NOB DATA All Rights Reserved. ご清聴、ありがとうございました・・! 何か個別のご相談やご質問がございましたら [email protected] (NOB DATA問い合わせ窓⼝) までお気軽にどうぞ。