Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20240418_Google ColabにLLMが搭載されたようなのでPython x デー...
Search
NobuakiOshiro
PRO
April 18, 2024
Technology
0
390
20240418_Google ColabにLLMが搭載されたようなのでPython x データ分析の勉強方法を考えてみる
https://pydatafukuoka.connpass.com/event/312982/
NobuakiOshiro
PRO
April 18, 2024
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20250301_android版ChatGPTアプリ利用手順.pdf
doradora09
PRO
0
7
第3回ポチポチゲームの会_o3-mini-hihgで出来ること
doradora09
PRO
0
31
20250208_OpenAIDeepResearchがやばいという話
doradora09
PRO
0
180
20250207_第5回_データサイエンティストの応援団_ゲスト我妻さん
doradora09
PRO
0
20
20250127_チャットだけじゃない_生成AIでタスクの5合目まで5分で登る方法(50min版)_v1.00
doradora09
PRO
0
33
20250118_LT_3D風ゲームを作ろうとして苦戦している話(作りかけ)
doradora09
PRO
0
37
20250111_ChatGPT部第58回_オープニングトークand年始のご挨拶
doradora09
PRO
0
63
20241228_ChatGPT部第57回_オープニングトークand振り返り
doradora09
PRO
0
83
20241224_第3回_データサイエンティストの応援団_ゲスト光安さん_公開用
doradora09
PRO
0
38
Other Decks in Technology
See All in Technology
Pwned Labsのすゝめ
ken5scal
1
310
データマネジメントのトレードオフに立ち向かう
ikkimiyazaki
6
1.2k
ソフトウェアエンジニアと仕事するときに知っておいたほうが良いこと / Key points for working with software engineers
pinkumohikan
1
140
Autonomous Database Serverless 技術詳細 / adb-s_technical_detail_jp
oracle4engineer
PRO
17
45k
IAMポリシーのAllow/Denyについて、改めて理解する
smt7174
2
190
ディスプレイ広告(Yahoo!広告・LINE広告)におけるバックエンド開発
lycorptech_jp
PRO
0
270
ウォンテッドリーのデータパイプラインを支える ETL のための analytics, rds-exporter / analytics, rds-exporter for ETL to support Wantedly's data pipeline
unblee
0
120
生成AI×財務経理:PoCで挑むSlack AI Bot開発と現場巻き込みのリアル
pohdccoe
1
530
(機械学習システムでも) SLO から始める信頼性構築 - ゆる SRE#9 2025/02/21
daigo0927
0
250
Iceberg Meetup Japan #1 : Iceberg and Databricks
databricksjapan
0
310
2025-02-21 ゆるSRE勉強会 Enhancing SRE Using AI
yoshiiryo1
1
480
LINE NEWSにおけるバックエンド開発
lycorptech_jp
PRO
0
170
Featured
See All Featured
The Illustrated Children's Guide to Kubernetes
chrisshort
48
49k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Building Flexible Design Systems
yeseniaperezcruz
328
38k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
12
980
Rebuilding a faster, lazier Slack
samanthasiow
80
8.8k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
30
2.2k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
4
430
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
129
19k
Designing for humans not robots
tammielis
250
25k
Practical Orchestrator
shlominoach
186
10k
Product Roadmaps are Hard
iamctodd
PRO
50
11k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
33
2.1k
Transcript
Google ColabにLLMが 搭載されたようなので Python x データ分析の 勉強⽅法を考えてみる 2024/4/18 @doradora09
⾃⼰紹介 • ⼤城 信晃(@doradora09) • データサイエンティスト • NOB DATA(株)代表 •
PyData.Fukuokaの主催者 • 最近はもっぱら⽣成AI活⽤ を模索中
本⽇の⾻⼦ • Google Colabにコード⽣成⽀援のLLMが搭載(期間限定で無 料)されたのでそちらも触りつつ、「⽣成AI時代の学習⽅法」に ついて • ただし、プログラミング以外のタスク、例えば学習のカリキュ ラム作成やデータの解釈性能はChatGPT-4(有料版)の⽅が良 かったりするので、そちらも使いつつ
⽣成AI時代の学習⽅法 • 「⾃分でLLMを使って学習 カリキュラムを作る」ことが 可能 • ChatGPT部の原⽥さんの記事 なども参考になります • 「分析アプローチ⽅法の相
談」「コード⽣成」「エラー 相談」も可能 • ただ、実⽤上はちゃんと⼿で 覚えないとまだまだ現場では 使えないので注意 原⽥さんの記事 https://note.com/chatgpt_nobdata/n/n63d730f93f44
①カリキュラムの⽣成 • ①カリキュラムの⽣成 -> やりたいことを伝える -> こちらのレベルを伝える -> 何をしたら良いか聞く ->
カリキュラムを作ってもらう • ②個別トピックの深掘り -> 講義概要を作ってもらう -> 演習問題を作ってもらう -> コード付きで解説してもらう • ③Google Colabで動かしてみる • 分からないところを質問してみる • ④演習問題の回答をレビューしてもらう ChatGPT-4のログ: https://chat.openai.com/share/0e6d1545-272b-4300- 9b96-e838d12a08f0
①カリキュラムの⽣成
②個別トピックの深掘り • ①カリキュラムの⽣成 -> やりたいことを伝える -> こちらのレベルを伝える -> 何をしたら良いか聞く ->
カリキュラムを作ってもらう • ②個別トピックの深掘り -> 講義概要を作ってもらう -> 演習問題を作ってもらう -> コード付きで解説してもらう • ③Google Colabで動かしてみる • 分からないところを質問してみる • ④演習問題の回答をレビューしてもらう
②個別トピックの深掘り
②個別トピックの深掘り
②個別トピックの深掘り
②個別トピックの深掘り
③Google Colabで動かしてみる AIでのコード⽣成機能も 期間限定で無料利⽤可能 • ①カリキュラムの⽣成 -> やりたいことを伝える -> こちらのレベルを伝える
-> 何をしたら良いか聞く -> カリキュラムを作ってもらう • ②個別トピックの深掘り -> 講義概要を作ってもらう -> 演習問題を作ってもらう -> コード付きで解説してもらう • ③Google Colabで動かしてみる • 分からないところを質問してみる • ④演習問題の回答をレビューしてもらう
• 問題に利⽤するファイルは適宜 driveにアップロード(r3.1.xlsx) • 今回の交通事故データはこちらの オープンデータ • 福岡県オープンデータ 2021 交通事故(1⽉発⽣)
• https://data.bodik.jp/datase t/401000_2021koutauujiko_t sukibetsu/resource/e551a7e c-6bd7-40ed-aa1a- bfea76df23c5 • Driveに接続しないでテンポラリ的 にファイルを設置することも可能 ( Colabのランタイムが切れると データ消失 ) ③Google Colabで動かしてみる
• ファイルパスのみ修正。 (この辺りは最低限のIT知識は必要) • 最初はコピペも良いですが、写経 するのも良いと思います。(⼿で覚 える) ③Google Colabで動かしてみる
Tips : プロット時の⽇本語⽂字化け対策 • Google Colabはデフォルトだと⽇ 本語を使ったプロットは軸が⽂字 化けしたりするので、この辺りを 使うか、ChatGPTに相談して必要 な⽇本語フォントを⼊れたりしま
す pip install japanize-matplotlib import japanize_matplotlib
Tips : Google ColabのLLM • Google ColabのLLMが期間限定で 無料で使えます • 「こういうコードを書いて」とい
う指⽰も出せます • ただし、前のコードを参照してい るわけではないので、使い勝⼿は 今ひとつ。ちょっとした使い⽅を 確認するくらいが現状は良いです (ChatGPT-4やCursorエディタであ れば、その前の処理結果なども踏 まえてコード⽣成をしてくれる)
Tips : Google ColabのLLM • Google ColabのLLMが期間限定で 無料で使えます • 「こういうコードを書いて」とい
う指⽰も出せます • ただし、前のコードを参照してい るわけではないので、使い勝⼿は 今ひとつ。ちょっとした使い⽅を 確認するくらいが現状は良いです (ChatGPT-4やCursorエディタであ れば、その前の処理結果なども踏 まえてコード⽣成をしてくれる)
④演習問題をChatGPT-4にレビューしてもらう • ①カリキュラムの⽣成 -> やりたいことを伝える -> こちらのレベルを伝える -> 何をしたら良いか聞く ->
カリキュラムを作ってもらう • ②個別トピックの深掘り -> 講義概要を作ってもらう -> 演習問題を作ってもらう -> コード付きで解説してもらう • ③Google Colabで動かしてみる • 分からないところを質問してみる • ④演習問題の回答をレビューしてもらう
④演習問題をChatGPT-4にレビューしてもらう
演習問題1の回答例 (Google ColabのLLM) 演習問題1のレビュー後 (OpenAI ChatGPT-4) ④演習問題をChatGPT-4にレビューしてもらう
まとめ • やりたいことを伝える -> こちらのレベルを伝える -> 何をしたら良いか聞く -> カリキュラムを作ってもらう •
個別トピックの深掘り -> 講義概要を作ってもらう -> 演習問題を作ってもらう -> コード付きで解説してもらう • Google Colabで動かしてみる • 分からないところを質問してみる • 演習問題の回答をレビューしてもらう ChatGPT-4と Google Colabで 独学し放題
補⾜:専⽤ツールも便利 • 有料にはなりますが、裏でChatGPT-4や Claude3のAPIをコールできるCursorエ ディタも便利です (複数のファイル・コードを横断して読み 込んだ後、提案してくれます) • R⾔語の例で過去にスライドをまとめてた りしますので、ご興味お持ちの⽅はご参
照ください ( もちろん、Python⾔語もいけます ) https://speakerdeck.com/doradora09/20240309-lt-chatgpt- 4dui-ying-nocursoreteitate-ryan-yu-kadong- kanaikatiyotutohong-tutemitahua
Enjoy..!!