Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20240418_Google ColabにLLMが搭載されたようなのでPython x デー...
Search
NobuakiOshiro
PRO
April 18, 2024
Technology
0
420
20240418_Google ColabにLLMが搭載されたようなのでPython x データ分析の勉強方法を考えてみる
https://pydatafukuoka.connpass.com/event/312982/
NobuakiOshiro
PRO
April 18, 2024
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20250726_DeepResearchで何かしらの情報を調べた後のTips
doradora09
PRO
1
46
20250718_分析業務への生成AI活用(テキストマイニングを例題に)
doradora09
PRO
1
78
20250715_AI時代到来・企業リスクへの生成AI活用術
doradora09
PRO
0
67
20250709_MacStudioとLlama-4Maverickでローカル画像認識
doradora09
PRO
1
50
20250709_第3回_GenAIアナリティクス勉強会at東京_オープニングトーク
doradora09
PRO
0
74
20250625_生成 AI 活用2年目の壁を突破せよ_(60min版)
doradora09
PRO
0
53
20250628_生成AIおすすめyoutube共有会_ChatGPT部第69回
doradora09
PRO
0
65
20250614_LT_走れメロスの個人情報マスク処理をMacStudio 512GBメモリマシンで試してみた
doradora09
PRO
1
12
20250607_AIから始めるロボット勉強会_HuggingFaceについて
doradora09
PRO
0
26
Other Decks in Technology
See All in Technology
マルチプロダクト×マルチテナントを支えるモジュラモノリスを中心としたアソビューのアーキテクチャ
disc99
1
530
Jamf Connect ZTNAとMDMで実現! 金融ベンチャーにおける「デバイストラスト」実例と軌跡 / Kyash Device Trust
rela1470
1
200
S3 Glacier のデータを Athena からクエリしようとしたらどうなるのか/try-to-query-s3-glacier-from-athena
emiki
0
220
Telemetry APIから学ぶGoogle Cloud ObservabilityとOpenTelemetryの現在 / getting-started-telemetry-api-with-google-cloud
k6s4i53rx
0
150
相互運用可能な学修歴クレデンシャルに向けた標準技術と国際動向
fujie
0
250
専門分化が進む分業下でもユーザーが本当に欲しかったものを追求するプロダクトマネジメント/Focus on real user needs despite deep specialization and division of labor
moriyuya
1
1.3k
開発 × 生成AI × コミュニケーション:GENDAの開発現場で感じたコミュニケーションの変化 / GENDA Tech Talk #1
genda
0
220
全員が手を動かす組織へ - 生成AIが変えるTVerの開発現場 / everyone-codes-genai-transforms-tver-development
tohae
0
180
金融サービスにおける高速な価値提供とAIの役割 #BetAIDay
layerx
PRO
1
830
LLMで構造化出力の成功率をグンと上げる方法
keisuketakiguchi
0
830
Claude Codeが働くAI中心の業務システム構築の挑戦―AIエージェント中心の働き方を目指して
os1ma
9
2.6k
データモデリング通り #2オンライン勉強会 ~方法論の話をしよう~
datayokocho
0
160
Featured
See All Featured
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
15
1.6k
Optimising Largest Contentful Paint
csswizardry
37
3.4k
A better future with KSS
kneath
239
17k
Designing for humans not robots
tammielis
253
25k
Music & Morning Musume
bryan
46
6.7k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
50
5.5k
Git: the NoSQL Database
bkeepers
PRO
431
65k
The Straight Up "How To Draw Better" Workshop
denniskardys
235
140k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Code Reviewing Like a Champion
maltzj
524
40k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Become a Pro
speakerdeck
PRO
29
5.5k
Transcript
Google ColabにLLMが 搭載されたようなので Python x データ分析の 勉強⽅法を考えてみる 2024/4/18 @doradora09
⾃⼰紹介 • ⼤城 信晃(@doradora09) • データサイエンティスト • NOB DATA(株)代表 •
PyData.Fukuokaの主催者 • 最近はもっぱら⽣成AI活⽤ を模索中
本⽇の⾻⼦ • Google Colabにコード⽣成⽀援のLLMが搭載(期間限定で無 料)されたのでそちらも触りつつ、「⽣成AI時代の学習⽅法」に ついて • ただし、プログラミング以外のタスク、例えば学習のカリキュ ラム作成やデータの解釈性能はChatGPT-4(有料版)の⽅が良 かったりするので、そちらも使いつつ
⽣成AI時代の学習⽅法 • 「⾃分でLLMを使って学習 カリキュラムを作る」ことが 可能 • ChatGPT部の原⽥さんの記事 なども参考になります • 「分析アプローチ⽅法の相
談」「コード⽣成」「エラー 相談」も可能 • ただ、実⽤上はちゃんと⼿で 覚えないとまだまだ現場では 使えないので注意 原⽥さんの記事 https://note.com/chatgpt_nobdata/n/n63d730f93f44
①カリキュラムの⽣成 • ①カリキュラムの⽣成 -> やりたいことを伝える -> こちらのレベルを伝える -> 何をしたら良いか聞く ->
カリキュラムを作ってもらう • ②個別トピックの深掘り -> 講義概要を作ってもらう -> 演習問題を作ってもらう -> コード付きで解説してもらう • ③Google Colabで動かしてみる • 分からないところを質問してみる • ④演習問題の回答をレビューしてもらう ChatGPT-4のログ: https://chat.openai.com/share/0e6d1545-272b-4300- 9b96-e838d12a08f0
①カリキュラムの⽣成
②個別トピックの深掘り • ①カリキュラムの⽣成 -> やりたいことを伝える -> こちらのレベルを伝える -> 何をしたら良いか聞く ->
カリキュラムを作ってもらう • ②個別トピックの深掘り -> 講義概要を作ってもらう -> 演習問題を作ってもらう -> コード付きで解説してもらう • ③Google Colabで動かしてみる • 分からないところを質問してみる • ④演習問題の回答をレビューしてもらう
②個別トピックの深掘り
②個別トピックの深掘り
②個別トピックの深掘り
②個別トピックの深掘り
③Google Colabで動かしてみる AIでのコード⽣成機能も 期間限定で無料利⽤可能 • ①カリキュラムの⽣成 -> やりたいことを伝える -> こちらのレベルを伝える
-> 何をしたら良いか聞く -> カリキュラムを作ってもらう • ②個別トピックの深掘り -> 講義概要を作ってもらう -> 演習問題を作ってもらう -> コード付きで解説してもらう • ③Google Colabで動かしてみる • 分からないところを質問してみる • ④演習問題の回答をレビューしてもらう
• 問題に利⽤するファイルは適宜 driveにアップロード(r3.1.xlsx) • 今回の交通事故データはこちらの オープンデータ • 福岡県オープンデータ 2021 交通事故(1⽉発⽣)
• https://data.bodik.jp/datase t/401000_2021koutauujiko_t sukibetsu/resource/e551a7e c-6bd7-40ed-aa1a- bfea76df23c5 • Driveに接続しないでテンポラリ的 にファイルを設置することも可能 ( Colabのランタイムが切れると データ消失 ) ③Google Colabで動かしてみる
• ファイルパスのみ修正。 (この辺りは最低限のIT知識は必要) • 最初はコピペも良いですが、写経 するのも良いと思います。(⼿で覚 える) ③Google Colabで動かしてみる
Tips : プロット時の⽇本語⽂字化け対策 • Google Colabはデフォルトだと⽇ 本語を使ったプロットは軸が⽂字 化けしたりするので、この辺りを 使うか、ChatGPTに相談して必要 な⽇本語フォントを⼊れたりしま
す pip install japanize-matplotlib import japanize_matplotlib
Tips : Google ColabのLLM • Google ColabのLLMが期間限定で 無料で使えます • 「こういうコードを書いて」とい
う指⽰も出せます • ただし、前のコードを参照してい るわけではないので、使い勝⼿は 今ひとつ。ちょっとした使い⽅を 確認するくらいが現状は良いです (ChatGPT-4やCursorエディタであ れば、その前の処理結果なども踏 まえてコード⽣成をしてくれる)
Tips : Google ColabのLLM • Google ColabのLLMが期間限定で 無料で使えます • 「こういうコードを書いて」とい
う指⽰も出せます • ただし、前のコードを参照してい るわけではないので、使い勝⼿は 今ひとつ。ちょっとした使い⽅を 確認するくらいが現状は良いです (ChatGPT-4やCursorエディタであ れば、その前の処理結果なども踏 まえてコード⽣成をしてくれる)
④演習問題をChatGPT-4にレビューしてもらう • ①カリキュラムの⽣成 -> やりたいことを伝える -> こちらのレベルを伝える -> 何をしたら良いか聞く ->
カリキュラムを作ってもらう • ②個別トピックの深掘り -> 講義概要を作ってもらう -> 演習問題を作ってもらう -> コード付きで解説してもらう • ③Google Colabで動かしてみる • 分からないところを質問してみる • ④演習問題の回答をレビューしてもらう
④演習問題をChatGPT-4にレビューしてもらう
演習問題1の回答例 (Google ColabのLLM) 演習問題1のレビュー後 (OpenAI ChatGPT-4) ④演習問題をChatGPT-4にレビューしてもらう
まとめ • やりたいことを伝える -> こちらのレベルを伝える -> 何をしたら良いか聞く -> カリキュラムを作ってもらう •
個別トピックの深掘り -> 講義概要を作ってもらう -> 演習問題を作ってもらう -> コード付きで解説してもらう • Google Colabで動かしてみる • 分からないところを質問してみる • 演習問題の回答をレビューしてもらう ChatGPT-4と Google Colabで 独学し放題
補⾜:専⽤ツールも便利 • 有料にはなりますが、裏でChatGPT-4や Claude3のAPIをコールできるCursorエ ディタも便利です (複数のファイル・コードを横断して読み 込んだ後、提案してくれます) • R⾔語の例で過去にスライドをまとめてた りしますので、ご興味お持ちの⽅はご参
照ください ( もちろん、Python⾔語もいけます ) https://speakerdeck.com/doradora09/20240309-lt-chatgpt- 4dui-ying-nocursoreteitate-ryan-yu-kadong- kanaikatiyotutohong-tutemitahua
Enjoy..!!