Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LT_R_on_GoogleColab
Search
NobuakiOshiro
October 11, 2019
Technology
1
390
LT_R_on_GoogleColab
https://fukuoka-r.connpass.com/event/147096/
NobuakiOshiro
October 11, 2019
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
LT : ChatGPT-4でキャラクターのステータスを設定して対戦するロールプレイの実験メモ
doradora09
0
23
20240418_Google ColabにLLMが搭載されたようなのでPython x データ分析の勉強方法を考えてみる
doradora09
0
120
20240413_生成AI関連書籍_流し読みの所感
doradora09
0
20
20240330_img2imgで昔のゲーム画像をいい感じにする
doradora09
1
45
20240309_LT_ChatGPT-4対応のCursorエディタで R言語が動かないかちょっと触ってみた話
doradora09
0
89
20240302_ChatGPTで交通事故分析_ハンズオン_公開用
doradora09
0
140
20240229_20分で速習するChatGPT-4でできること
doradora09
0
220
20240217_CIVITAIの話をしようと思ったらOpenAI Soraが出てきたのでそちらの情報共有.pdf
doradora09
0
53
20240209_丸善博多_データで話す組織_出版記念ミニトーク.pdf
doradora09
0
120
Other Decks in Technology
See All in Technology
Azure Container Apps + Bicep 〜 こんな感じで運用しています
kaz29
2
450
アクセス制御にまつわる改善 / Improving access control
itkq
0
520
継続的な改善 x ⾮連続的な進化
sansantech
PRO
3
140
Kernel MemoryでAzure OpenAI Serviceとお手軽データソース連携
mitsuzono
1
230
マルチアカウント環境への発見的統制の導入
ch1aki
1
1.3k
推しは推せるときに推せ! プロダクトにフィードバックしていこう
nakasho
0
290
NgRx Signal Store
rainerhahnekamp
0
150
ここが嬉しいABAC ここが辛いよABAC #再解説+補足編
masahirokawahara
1
270
Python と Snowflake はズッ友だょ!~ Snowflake の Python 関連機能をふりかえる ~
__allllllllez__
1
110
[新卒向け研修資料] テスト文字列に「うんこ」と入れるな(2024年版)
infiniteloop_inc
2
9.3k
Google Cloud Next '24でブログを10本書いた方法と勉強会を沸かせた方法
yasumuusan
0
290
検証を通して見えてきたTiDBの性能特性
lycorptech_jp
PRO
6
3.7k
Featured
See All Featured
Faster Mobile Websites
deanohume
299
30k
Unsuck your backbone
ammeep
663
57k
The Mythical Team-Month
searls
216
42k
Producing Creativity
orderedlist
PRO
337
39k
Building Better People: How to give real-time feedback that sticks.
wjessup
355
18k
Scaling GitHub
holman
457
140k
Debugging Ruby Performance
tmm1
70
11k
The Cult of Friendly URLs
andyhume
74
5.7k
Keith and Marios Guide to Fast Websites
keithpitt
408
22k
Designing on Purpose - Digital PM Summit 2013
jponch
110
6.5k
What the flash - Photography Introduction
edds
64
11k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
14
1.5k
Transcript
LT R on Google Colab ~ いい感じに処理を共有したい ~ Yakitori.R#02 2019/10/11
@doradora09
⾃⼰紹介 • NOB DATAの⼤城です • 最近クラウド本書きました ->
イベント告知 SpaTech #02 (11/16) • 温泉地でデータ分析勉強会 • 各分析コミュニティの⽅々と、⼤分 の⽅々をつなげられればと思います のでご都合つきましたら是⾮・・!
• ちなみに今回は⼤分県から補助が出 ます https://spatech.connpass.com/event/151005/
本題 課題感 • 分析結果を共有したい!が様々なハードルがある • ⾃分以外のPCにRをインストールするのが⼤変 • サーバの知識がなく、社内でJupyterやRStudioのWebサーバは⽴てられない • サーバの知識はあるが、AWS等のインスタンスを⽴ち上げる予算がない
• 無料、かつPDFやhtmlファイルで共有する以外の⽅法はないものか? 今回 • GoogleColabで直接Rを動かす⽅法のご紹介
GoogleColabのスペックと制限 • スペック • 搭載CPUはIntel(R) Xeon(R) CPU @ 2.30GHz •
メモリーは13GB、データ容量は40GB • GPU、TPUが無料で使える • 制限 • 連続利⽤12時間まで • 90分間アイドル状態が続くとインスタンスがシャットダウン
Rを乗せる前に・・ GoogleColabの基礎
Google Colaboratoryを利⽤する HPPHMFυϥΠϒΞΫηε
ʴ৽ن ΛΫϦοΫ
ΞϓϦΛՃ ΛΫϦοΫ ͦͷଞ
DPMBCPSBUPSZͰݕࡧ ଓϘλϯΛΫϦοΫ
Google Colab上でRを使う⽅法 • 2つご紹介 • お⼿軽な⽅法 • rpy2でPythonと共存したまま使う • ⼀⼿間かける⽅法
• ipynbファイルを書き換えてRのノートブックとして設定する 参考 https://www.marketechlabo.com/google-colaboratory-with-r/
その1:rpy2でPythonと共存したまま使う • rpy2を使うと%%RブロックでRを呼び出すことが可能になる • %load_ext rpy2.ipythonを記載するだけでOK
rpy2のインストールと %%RブロックでRコードの実⾏
install.packages()も使える
決定⽊とかも動く
その2:ipynbを書き換える⽅法 • .ipynbファイルの中⾝を書き換える⽅法 • ⼀⼿間かかるが、Rのコードをそのまま呼び出せる
任意のノートブックを作成し、 .ipynbをダウンロード
.ipynbファイルを2⾏書き換え (nameをirに、display_nameをRにする)
書き換えた.ipynbファイルを アップロードすればOK
あとはRのコードを書くだけ • 1つ⽬の⽅法と違って%%Rのようなブロックは不要
あとはRのコードを書くだけ • 1つ⽬の⽅法と違って%%Rのようなブロックは不要
GoogleColabのデメリットと セッション切れ問題対策 • 90分以上かかる処理の場合はリ ロード必須 • chormeの拡張機能などで定期的 なブラウザのリロードはお⼿軽 に実施できる •
もちろん、PCがスリープしない 設定でやる必要はあり https://chrome.google.com/webstore/detail/auto- refresh/ifooldnmmcmlbdennkpdnlnbgbmfalko
動かなかったもの • rpivotTableとかplotlyパッケージは動かない (knitやHTML出⼒が前提だから?) • ⼿軽にインタラクティブに動かせる環境あると最⾼なので、何 かノウハウありましたらお知らせ下さい
所感 場⾯によっては選択肢としてはあり • 費⽤をかけず、社内データの簡単な分析と共有 良い点 • 無料でハイスペックなマシンが使え、権限管理も可能 向かない点 • (現時点では)凝った処理やGUIでグリグリやりたい場合は素直
にPythonからplotly等各種ライブラリを呼び出す⽅法が楽
余談 • ⽤途が社内でのデータ解析結果の共有ではなく、 単に機械学習の勉強ならkaggleのカーネル使う⽅法もあります • こっちはRに標準対応
まとめ • Google ColabからRで使う⽅法をいくつかご紹介 • rpy2を使う⽅法、ipynbを書き換える⽅法 • 90分タイムアウト問題はブラウザの拡張機能などで対応可能 • 共有範囲の管理もできるので、社内データの簡単な処理やレ
ポートの共有には向いている • ⼀⽅、機械学習の勉強⽤途だけならKaggleのnotebook使うと良い • ⼀応hack的な⽅法なので、現時点では凝った処理は素直に Pythonで書く、といった使い分けが良いかも
Enjoy!