Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LT_R_on_GoogleColab
Search
NobuakiOshiro
PRO
October 11, 2019
Technology
1
410
LT_R_on_GoogleColab
https://fukuoka-r.connpass.com/event/147096/
NobuakiOshiro
PRO
October 11, 2019
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
[NotebookLM製]20251210_AIによる前処理について
doradora09
PRO
0
5
20251122_第1回ローカルLLMなんでも勉強会_オープニングトーク
doradora09
PRO
0
100
20251122_LT_スマホ版軽量ローカルLLMで人物名マスク
doradora09
PRO
0
98
20251120_LT_AIで今年の漢字を予想する
doradora09
PRO
0
45
20251120_生成AI(LLM)で自習する方法とバイブコーディング入門
doradora09
PRO
0
19
20251025_LT_catgpt_atlasでわかるOpenAI歴
doradora09
PRO
0
44
20251015_LT_BIのAIがAGI過渡期は流行るのではと思った話
doradora09
PRO
0
18
20251015_第4回_GenAIアナリティクス勉強会at東京_オープニングトーク
doradora09
PRO
0
6
20251011_第75回ChatGPT部_オープニングトーク_v1.00
doradora09
PRO
0
61
Other Decks in Technology
See All in Technology
Sansanが実践する Platform EngineeringとSREの協創
sansantech
PRO
2
910
コミューンのデータ分析AIエージェント「Community Sage」の紹介
fufufukakaka
0
510
Haskell を武器にして挑む競技プログラミング ─ 操作的思考から意味モデル思考へ
naoya
6
1.6k
ChatGPTで論⽂は読めるのか
spatial_ai_network
10
29k
「Managed Instances」と「durable functions」で広がるAWS Lambdaのユースケース
lamaglama39
0
330
AWS CLIの新しい認証情報設定方法aws loginコマンドの実態
wkm2
6
750
20251209_WAKECareer_生成AIを活用した設計・開発プロセス
syobochim
7
1.6k
モダンデータスタック (MDS) の話とデータ分析が起こすビジネス変革
sutotakeshi
0
500
【U/day Tokyo 2025】Cygames流 最新スマートフォンゲームの技術設計 〜『Shadowverse: Worlds Beyond』におけるアーキテクチャ再設計の挑戦~
cygames
PRO
2
390
ディメンショナルモデリングを支えるData Vaultについて
10xinc
1
100
Microsoft Agent 365 についてゆっくりじっくり理解する!
skmkzyk
0
370
.NET 10の概要
tomokusaba
0
110
Featured
See All Featured
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.8k
Java REST API Framework Comparison - PWX 2021
mraible
34
9k
Writing Fast Ruby
sferik
630
62k
Side Projects
sachag
455
43k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.1k
RailsConf 2023
tenderlove
30
1.3k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
710
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
GitHub's CSS Performance
jonrohan
1032
470k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
9
1k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
Transcript
LT R on Google Colab ~ いい感じに処理を共有したい ~ Yakitori.R#02 2019/10/11
@doradora09
⾃⼰紹介 • NOB DATAの⼤城です • 最近クラウド本書きました ->
イベント告知 SpaTech #02 (11/16) • 温泉地でデータ分析勉強会 • 各分析コミュニティの⽅々と、⼤分 の⽅々をつなげられればと思います のでご都合つきましたら是⾮・・!
• ちなみに今回は⼤分県から補助が出 ます https://spatech.connpass.com/event/151005/
本題 課題感 • 分析結果を共有したい!が様々なハードルがある • ⾃分以外のPCにRをインストールするのが⼤変 • サーバの知識がなく、社内でJupyterやRStudioのWebサーバは⽴てられない • サーバの知識はあるが、AWS等のインスタンスを⽴ち上げる予算がない
• 無料、かつPDFやhtmlファイルで共有する以外の⽅法はないものか? 今回 • GoogleColabで直接Rを動かす⽅法のご紹介
GoogleColabのスペックと制限 • スペック • 搭載CPUはIntel(R) Xeon(R) CPU @ 2.30GHz •
メモリーは13GB、データ容量は40GB • GPU、TPUが無料で使える • 制限 • 連続利⽤12時間まで • 90分間アイドル状態が続くとインスタンスがシャットダウン
Rを乗せる前に・・ GoogleColabの基礎
Google Colaboratoryを利⽤する HPPHMFυϥΠϒΞΫηε
ʴ৽ن ΛΫϦοΫ
ΞϓϦΛՃ ΛΫϦοΫ ͦͷଞ
DPMBCPSBUPSZͰݕࡧ ଓϘλϯΛΫϦοΫ
Google Colab上でRを使う⽅法 • 2つご紹介 • お⼿軽な⽅法 • rpy2でPythonと共存したまま使う • ⼀⼿間かける⽅法
• ipynbファイルを書き換えてRのノートブックとして設定する 参考 https://www.marketechlabo.com/google-colaboratory-with-r/
その1:rpy2でPythonと共存したまま使う • rpy2を使うと%%RブロックでRを呼び出すことが可能になる • %load_ext rpy2.ipythonを記載するだけでOK
rpy2のインストールと %%RブロックでRコードの実⾏
install.packages()も使える
決定⽊とかも動く
その2:ipynbを書き換える⽅法 • .ipynbファイルの中⾝を書き換える⽅法 • ⼀⼿間かかるが、Rのコードをそのまま呼び出せる
任意のノートブックを作成し、 .ipynbをダウンロード
.ipynbファイルを2⾏書き換え (nameをirに、display_nameをRにする)
書き換えた.ipynbファイルを アップロードすればOK
あとはRのコードを書くだけ • 1つ⽬の⽅法と違って%%Rのようなブロックは不要
あとはRのコードを書くだけ • 1つ⽬の⽅法と違って%%Rのようなブロックは不要
GoogleColabのデメリットと セッション切れ問題対策 • 90分以上かかる処理の場合はリ ロード必須 • chormeの拡張機能などで定期的 なブラウザのリロードはお⼿軽 に実施できる •
もちろん、PCがスリープしない 設定でやる必要はあり https://chrome.google.com/webstore/detail/auto- refresh/ifooldnmmcmlbdennkpdnlnbgbmfalko
動かなかったもの • rpivotTableとかplotlyパッケージは動かない (knitやHTML出⼒が前提だから?) • ⼿軽にインタラクティブに動かせる環境あると最⾼なので、何 かノウハウありましたらお知らせ下さい
所感 場⾯によっては選択肢としてはあり • 費⽤をかけず、社内データの簡単な分析と共有 良い点 • 無料でハイスペックなマシンが使え、権限管理も可能 向かない点 • (現時点では)凝った処理やGUIでグリグリやりたい場合は素直
にPythonからplotly等各種ライブラリを呼び出す⽅法が楽
余談 • ⽤途が社内でのデータ解析結果の共有ではなく、 単に機械学習の勉強ならkaggleのカーネル使う⽅法もあります • こっちはRに標準対応
まとめ • Google ColabからRで使う⽅法をいくつかご紹介 • rpy2を使う⽅法、ipynbを書き換える⽅法 • 90分タイムアウト問題はブラウザの拡張機能などで対応可能 • 共有範囲の管理もできるので、社内データの簡単な処理やレ
ポートの共有には向いている • ⼀⽅、機械学習の勉強⽤途だけならKaggleのnotebook使うと良い • ⼀応hack的な⽅法なので、現時点では凝った処理は素直に Pythonで書く、といった使い分けが良いかも
Enjoy!