Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LT_R_on_GoogleColab
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
NobuakiOshiro
PRO
October 11, 2019
Technology
420
1
Share
LT_R_on_GoogleColab
https://fukuoka-r.connpass.com/event/147096/
NobuakiOshiro
PRO
October 11, 2019
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20260415_生成AIを専属DSに_自動レポート作成_ハンズオン_交通事故データ
doradora09
PRO
0
83
20260412_生成AIとの付き合い方_上手に使うためのヒント
doradora09
PRO
0
18
20260404_3年W封鎖ケースシミュレーション_サマリとレビュー付き
doradora09
PRO
0
39
20260404_4つのLLMでのイラン情勢予測_統合版_レビュー付き
doradora09
PRO
0
41
20260404_医療関係へのイラン情勢への影響モニタリング_レビュー付き
doradora09
PRO
0
77
20260403_(簡易)AI欠品予測レポートの作り方_大城.pdf
doradora09
PRO
0
64
20260329_修正版_v2b_バブ・エル・マンデブ海峡封鎖リスクと日本のナフサ危機_AIシナリオ予測_AIレビュー付
doradora09
PRO
0
44
20260328_LT_花見会場をAIで探す
doradora09
PRO
0
65
20260328_中東情勢の2日差分_サマリ+レビュー付き
doradora09
PRO
0
94
Other Decks in Technology
See All in Technology
サイバーフィジカル社会とは何か / What Is a Cyber-Physical Society?
ks91
PRO
0
160
チームで育てるAI自走環境_20260409
fuktig
0
1k
機能・非機能の学びを一つに!Agent Skillsで月間レポート作成始めてみた / Unifying Bug & Infra Insights — Building Monthly Quality Reports with Agent Skills
bun913
5
3.9k
"SQLは書けません"から始まる データドリブン
kubell_hr
1
260
数案件を同時に進行するためのコンテキスト整理術
sutetotanuki
1
190
生成AI時代のエンジニア育成 変わる時代と変わらないコト
starfish719
0
590
システムは「動く」だけでは 足りない - 非機能要件・分散システム・トレードオフの基礎
nwiizo
26
8.3k
ログ基盤・プラグイン・ダッシュボード、全部整えた。でも最後は人だった。
makikub
5
1.6k
ふりかえりがなかった職能横断チームにふりかえりを導入してみて学んだこと 〜チームのふりかえりを「みんなで未来を考える場」にするプロローグ設計〜
masahiro1214shimokawa
0
340
Hooks, Filters & Now Context: Why MCPs Are the “Hooks” of the AI Era
miriamschwab
0
130
Zero Data Loss Autonomous Recovery Service サービス概要
oracle4engineer
PRO
5
14k
AIを活用したアクセシビリティ改善フロー
degudegu2510
1
170
Featured
See All Featured
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Designing Experiences People Love
moore
143
24k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
The agentic SEO stack - context over prompts
schlessera
0
740
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
110
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
300
The Spectacular Lies of Maps
axbom
PRO
1
680
How to Ace a Technical Interview
jacobian
281
24k
Six Lessons from altMBA
skipperchong
29
4.2k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
The Cost Of JavaScript in 2023
addyosmani
55
9.8k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Transcript
LT R on Google Colab ~ いい感じに処理を共有したい ~ Yakitori.R#02 2019/10/11
@doradora09
⾃⼰紹介 • NOB DATAの⼤城です • 最近クラウド本書きました ->
イベント告知 SpaTech #02 (11/16) • 温泉地でデータ分析勉強会 • 各分析コミュニティの⽅々と、⼤分 の⽅々をつなげられればと思います のでご都合つきましたら是⾮・・!
• ちなみに今回は⼤分県から補助が出 ます https://spatech.connpass.com/event/151005/
本題 課題感 • 分析結果を共有したい!が様々なハードルがある • ⾃分以外のPCにRをインストールするのが⼤変 • サーバの知識がなく、社内でJupyterやRStudioのWebサーバは⽴てられない • サーバの知識はあるが、AWS等のインスタンスを⽴ち上げる予算がない
• 無料、かつPDFやhtmlファイルで共有する以外の⽅法はないものか? 今回 • GoogleColabで直接Rを動かす⽅法のご紹介
GoogleColabのスペックと制限 • スペック • 搭載CPUはIntel(R) Xeon(R) CPU @ 2.30GHz •
メモリーは13GB、データ容量は40GB • GPU、TPUが無料で使える • 制限 • 連続利⽤12時間まで • 90分間アイドル状態が続くとインスタンスがシャットダウン
Rを乗せる前に・・ GoogleColabの基礎
Google Colaboratoryを利⽤する HPPHMFυϥΠϒΞΫηε
ʴ৽ن ΛΫϦοΫ
ΞϓϦΛՃ ΛΫϦοΫ ͦͷଞ
DPMBCPSBUPSZͰݕࡧ ଓϘλϯΛΫϦοΫ
Google Colab上でRを使う⽅法 • 2つご紹介 • お⼿軽な⽅法 • rpy2でPythonと共存したまま使う • ⼀⼿間かける⽅法
• ipynbファイルを書き換えてRのノートブックとして設定する 参考 https://www.marketechlabo.com/google-colaboratory-with-r/
その1:rpy2でPythonと共存したまま使う • rpy2を使うと%%RブロックでRを呼び出すことが可能になる • %load_ext rpy2.ipythonを記載するだけでOK
rpy2のインストールと %%RブロックでRコードの実⾏
install.packages()も使える
決定⽊とかも動く
その2:ipynbを書き換える⽅法 • .ipynbファイルの中⾝を書き換える⽅法 • ⼀⼿間かかるが、Rのコードをそのまま呼び出せる
任意のノートブックを作成し、 .ipynbをダウンロード
.ipynbファイルを2⾏書き換え (nameをirに、display_nameをRにする)
書き換えた.ipynbファイルを アップロードすればOK
あとはRのコードを書くだけ • 1つ⽬の⽅法と違って%%Rのようなブロックは不要
あとはRのコードを書くだけ • 1つ⽬の⽅法と違って%%Rのようなブロックは不要
GoogleColabのデメリットと セッション切れ問題対策 • 90分以上かかる処理の場合はリ ロード必須 • chormeの拡張機能などで定期的 なブラウザのリロードはお⼿軽 に実施できる •
もちろん、PCがスリープしない 設定でやる必要はあり https://chrome.google.com/webstore/detail/auto- refresh/ifooldnmmcmlbdennkpdnlnbgbmfalko
動かなかったもの • rpivotTableとかplotlyパッケージは動かない (knitやHTML出⼒が前提だから?) • ⼿軽にインタラクティブに動かせる環境あると最⾼なので、何 かノウハウありましたらお知らせ下さい
所感 場⾯によっては選択肢としてはあり • 費⽤をかけず、社内データの簡単な分析と共有 良い点 • 無料でハイスペックなマシンが使え、権限管理も可能 向かない点 • (現時点では)凝った処理やGUIでグリグリやりたい場合は素直
にPythonからplotly等各種ライブラリを呼び出す⽅法が楽
余談 • ⽤途が社内でのデータ解析結果の共有ではなく、 単に機械学習の勉強ならkaggleのカーネル使う⽅法もあります • こっちはRに標準対応
まとめ • Google ColabからRで使う⽅法をいくつかご紹介 • rpy2を使う⽅法、ipynbを書き換える⽅法 • 90分タイムアウト問題はブラウザの拡張機能などで対応可能 • 共有範囲の管理もできるので、社内データの簡単な処理やレ
ポートの共有には向いている • ⼀⽅、機械学習の勉強⽤途だけならKaggleのnotebook使うと良い • ⼀応hack的な⽅法なので、現時点では凝った処理は素直に Pythonで書く、といった使い分けが良いかも
Enjoy!