Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Tokyo.R #65 Session 2

eriver
September 23, 2017

Tokyo.R #65 Session 2

eriver

September 23, 2017
Tweet

More Decks by eriver

Other Decks in Technology

Transcript

  1. だれ? • えりばー (@eriver_jpn) • #55から参加。 • TokyoR#62で発表しました。 • https://speakerdeck.com/eriver_jpn/tokyo-dot-r-62-session-3

    • クラウドでのデータ活用相談コンサルタント@クラウド業者 • ど文系→国内SI会社(エンジニア)→統計ベンダー(コンサル)→現職 • エンタープライズ向け総合的なデータ活用支援案件の提案と推進 • 企画支援 / PMO / 技術調査 / 社内ヒアリング支援 / ユーザー教育 / 分析PoC実施 • 仕事上での興味/フォーカスエリア • 可視化や機械学習等のデータ活用手法を一般のレベルに広める方法 • 新しくデータサイエンスに触れる既存のIT技術者の教育・モチベーション向上 • 若手のデータサイエンティスト(本物)の価値向上 2
  2. Rを使うためには • 環境面 • クライアント(PC) • Rgui.exe . . .

    白い画面に赤い字が出ると怖い(個人的感想) • RStudio . . . サイコー。個人的には色替えの機能は欲しいが CSS直接編集でどうにかしている • サーバー • RStudio Server . . . 使い易いがLinuxしかサポートしてなくてWindows使いは鬱 • 仕事面 • レポーティングに使いたい • 機械学習するときにデータ加工目的で使いたい • Reproducible Researchの観点からJupyterが使いたい! • でもサーバー立てるのはめんどい • てか普通python用・・・・ 3
  3. 簡単な違い • Azure Machine Learning • Experiment(処理フロー)のモジュールの1つにRスクリプトが書け るものがある • Experimentとは別に、Jupyter

    Notebookが使える • このJupyterスクリプトからAzure MLのオブジェクトにアクセスできる • データはAzureMLの機能で読めるところからアクセスできる • Azure BLOB Storage、Azure • Azure Notebook • 単品のJupyter Notebookを提供 • OneDrive、Googleドライブ、Dropbox、ダイレクトアップロード可 • ターミナルアクセス 8
  4. もうちょっと細かい違い(今調べ) 9 カテゴリ Azure ML(R Script) Azure ML (Notebook) Azure

    Notebook バージョン CRAN R3.1.0 CRAN R3.1.1 Microsoft R Open 3.3.0 OS Windows Linux 読めるデータ AzureMLのデータセット Readerで読めるもの AzureMLのデータセット Rでダウンロードするな りすればなんでも? Dropbox Google Drive ダイレクトアップロード 使えるライブラリ Zipで上げれば何でも Install.packages() Devtools経由でgithubも使えるのでなんでも メモリ 56GB 不明 4GB 制約等 入力データ2つ、と出力 データ1つまでと決まっ ている 不明 プレビュー 最後に触って60分でタイ ムアウト(サーバー停 止) データなどは60日後に消 える プレビュー
  5. サービスへのログイン • アカウントができたら以下よりログイン • Azure Machine Learning • https://studio.azureml.net •

    Azure Notebook • https://notebooks.azure.com/ • 許可を求める系は「はい」 • ユーザーIDはランダムなので 必要に応じて修正する (全世界でユニークにする必要あり) 11