Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20240418_Google ColabにLLMが搭載されたようなのでPython x デー...
Search
NobuakiOshiro
PRO
April 18, 2024
Technology
0
380
20240418_Google ColabにLLMが搭載されたようなのでPython x データ分析の勉強方法を考えてみる
https://pydatafukuoka.connpass.com/event/312982/
NobuakiOshiro
PRO
April 18, 2024
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
第3回ポチポチゲームの会_o3-mini-hihgで出来ること
doradora09
PRO
0
22
20250208_OpenAIDeepResearchがやばいという話
doradora09
PRO
0
170
20250207_第5回_データサイエンティストの応援団_ゲスト我妻さん
doradora09
PRO
0
13
20250127_チャットだけじゃない_生成AIでタスクの5合目まで5分で登る方法(50min版)_v1.00
doradora09
PRO
0
28
20250118_LT_3D風ゲームを作ろうとして苦戦している話(作りかけ)
doradora09
PRO
0
29
20250111_ChatGPT部第58回_オープニングトークand年始のご挨拶
doradora09
PRO
0
58
20241228_ChatGPT部第57回_オープニングトークand振り返り
doradora09
PRO
0
78
20241224_第3回_データサイエンティストの応援団_ゲスト光安さん_公開用
doradora09
PRO
0
34
20241220_引き継ぎLT_後を託せるメンバーや参加者がいる技術系コミュニティは立ち上げ冥利に尽きると思う話
doradora09
PRO
0
76
Other Decks in Technology
See All in Technology
Moved to https://speakerdeck.com/toshihue/presales-engineer-career-bridging-tech-biz-ja
toshihue
2
550
5分で紹介する生成AIエージェントとAmazon Bedrock Agents / 5-minutes introduction to generative AI agents and Amazon Bedrock Agents
hideakiaoyagi
0
220
株式会社EventHub・エンジニア採用資料
eventhub
0
4.2k
管理者しか知らないOutlookの裏側のAIを覗く#AzureTravelers
hirotomotaguchi
2
240
Bounded Context: Problem or Solution?
ewolff
1
210
『AWS Distinguished Engineerに学ぶ リトライの技術』 #ARC403/Marc Brooker on Try again: The tools and techniques behind resilient systems
quiver
0
130
マルチモーダル理解と生成の統合 DeepSeek Janus, etc... / Multimodal Understanding and Generation Integration
hiroga
0
360
2.5Dモデルのすべて
yu4u
2
610
ハッキングの世界に迫る~攻撃者の思考で考えるセキュリティ~
nomizone
12
4.5k
インフラをつくるとはどういうことなのか、 あるいはPlatform Engineeringについて
nwiizo
5
2.1k
SA Night #2 FinatextのSA思想/SA Night #2 Finatext session
satoshiimai
1
100
データの品質が低いと何が困るのか
kzykmyzw
6
1k
Featured
See All Featured
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
330
21k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
193
16k
Practical Orchestrator
shlominoach
186
10k
Bash Introduction
62gerente
610
210k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
The Cult of Friendly URLs
andyhume
78
6.2k
Agile that works and the tools we love
rasmusluckow
328
21k
BBQ
matthewcrist
86
9.5k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
44
9.4k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
99
18k
Transcript
Google ColabにLLMが 搭載されたようなので Python x データ分析の 勉強⽅法を考えてみる 2024/4/18 @doradora09
⾃⼰紹介 • ⼤城 信晃(@doradora09) • データサイエンティスト • NOB DATA(株)代表 •
PyData.Fukuokaの主催者 • 最近はもっぱら⽣成AI活⽤ を模索中
本⽇の⾻⼦ • Google Colabにコード⽣成⽀援のLLMが搭載(期間限定で無 料)されたのでそちらも触りつつ、「⽣成AI時代の学習⽅法」に ついて • ただし、プログラミング以外のタスク、例えば学習のカリキュ ラム作成やデータの解釈性能はChatGPT-4(有料版)の⽅が良 かったりするので、そちらも使いつつ
⽣成AI時代の学習⽅法 • 「⾃分でLLMを使って学習 カリキュラムを作る」ことが 可能 • ChatGPT部の原⽥さんの記事 なども参考になります • 「分析アプローチ⽅法の相
談」「コード⽣成」「エラー 相談」も可能 • ただ、実⽤上はちゃんと⼿で 覚えないとまだまだ現場では 使えないので注意 原⽥さんの記事 https://note.com/chatgpt_nobdata/n/n63d730f93f44
①カリキュラムの⽣成 • ①カリキュラムの⽣成 -> やりたいことを伝える -> こちらのレベルを伝える -> 何をしたら良いか聞く ->
カリキュラムを作ってもらう • ②個別トピックの深掘り -> 講義概要を作ってもらう -> 演習問題を作ってもらう -> コード付きで解説してもらう • ③Google Colabで動かしてみる • 分からないところを質問してみる • ④演習問題の回答をレビューしてもらう ChatGPT-4のログ: https://chat.openai.com/share/0e6d1545-272b-4300- 9b96-e838d12a08f0
①カリキュラムの⽣成
②個別トピックの深掘り • ①カリキュラムの⽣成 -> やりたいことを伝える -> こちらのレベルを伝える -> 何をしたら良いか聞く ->
カリキュラムを作ってもらう • ②個別トピックの深掘り -> 講義概要を作ってもらう -> 演習問題を作ってもらう -> コード付きで解説してもらう • ③Google Colabで動かしてみる • 分からないところを質問してみる • ④演習問題の回答をレビューしてもらう
②個別トピックの深掘り
②個別トピックの深掘り
②個別トピックの深掘り
②個別トピックの深掘り
③Google Colabで動かしてみる AIでのコード⽣成機能も 期間限定で無料利⽤可能 • ①カリキュラムの⽣成 -> やりたいことを伝える -> こちらのレベルを伝える
-> 何をしたら良いか聞く -> カリキュラムを作ってもらう • ②個別トピックの深掘り -> 講義概要を作ってもらう -> 演習問題を作ってもらう -> コード付きで解説してもらう • ③Google Colabで動かしてみる • 分からないところを質問してみる • ④演習問題の回答をレビューしてもらう
• 問題に利⽤するファイルは適宜 driveにアップロード(r3.1.xlsx) • 今回の交通事故データはこちらの オープンデータ • 福岡県オープンデータ 2021 交通事故(1⽉発⽣)
• https://data.bodik.jp/datase t/401000_2021koutauujiko_t sukibetsu/resource/e551a7e c-6bd7-40ed-aa1a- bfea76df23c5 • Driveに接続しないでテンポラリ的 にファイルを設置することも可能 ( Colabのランタイムが切れると データ消失 ) ③Google Colabで動かしてみる
• ファイルパスのみ修正。 (この辺りは最低限のIT知識は必要) • 最初はコピペも良いですが、写経 するのも良いと思います。(⼿で覚 える) ③Google Colabで動かしてみる
Tips : プロット時の⽇本語⽂字化け対策 • Google Colabはデフォルトだと⽇ 本語を使ったプロットは軸が⽂字 化けしたりするので、この辺りを 使うか、ChatGPTに相談して必要 な⽇本語フォントを⼊れたりしま
す pip install japanize-matplotlib import japanize_matplotlib
Tips : Google ColabのLLM • Google ColabのLLMが期間限定で 無料で使えます • 「こういうコードを書いて」とい
う指⽰も出せます • ただし、前のコードを参照してい るわけではないので、使い勝⼿は 今ひとつ。ちょっとした使い⽅を 確認するくらいが現状は良いです (ChatGPT-4やCursorエディタであ れば、その前の処理結果なども踏 まえてコード⽣成をしてくれる)
Tips : Google ColabのLLM • Google ColabのLLMが期間限定で 無料で使えます • 「こういうコードを書いて」とい
う指⽰も出せます • ただし、前のコードを参照してい るわけではないので、使い勝⼿は 今ひとつ。ちょっとした使い⽅を 確認するくらいが現状は良いです (ChatGPT-4やCursorエディタであ れば、その前の処理結果なども踏 まえてコード⽣成をしてくれる)
④演習問題をChatGPT-4にレビューしてもらう • ①カリキュラムの⽣成 -> やりたいことを伝える -> こちらのレベルを伝える -> 何をしたら良いか聞く ->
カリキュラムを作ってもらう • ②個別トピックの深掘り -> 講義概要を作ってもらう -> 演習問題を作ってもらう -> コード付きで解説してもらう • ③Google Colabで動かしてみる • 分からないところを質問してみる • ④演習問題の回答をレビューしてもらう
④演習問題をChatGPT-4にレビューしてもらう
演習問題1の回答例 (Google ColabのLLM) 演習問題1のレビュー後 (OpenAI ChatGPT-4) ④演習問題をChatGPT-4にレビューしてもらう
まとめ • やりたいことを伝える -> こちらのレベルを伝える -> 何をしたら良いか聞く -> カリキュラムを作ってもらう •
個別トピックの深掘り -> 講義概要を作ってもらう -> 演習問題を作ってもらう -> コード付きで解説してもらう • Google Colabで動かしてみる • 分からないところを質問してみる • 演習問題の回答をレビューしてもらう ChatGPT-4と Google Colabで 独学し放題
補⾜:専⽤ツールも便利 • 有料にはなりますが、裏でChatGPT-4や Claude3のAPIをコールできるCursorエ ディタも便利です (複数のファイル・コードを横断して読み 込んだ後、提案してくれます) • R⾔語の例で過去にスライドをまとめてた りしますので、ご興味お持ちの⽅はご参
照ください ( もちろん、Python⾔語もいけます ) https://speakerdeck.com/doradora09/20240309-lt-chatgpt- 4dui-ying-nocursoreteitate-ryan-yu-kadong- kanaikatiyotutohong-tutemitahua
Enjoy..!!