Sendai.R#2

F697cb806688065ebba69a342e621434?s=47 tachyon7776
September 28, 2019

 Sendai.R#2

F697cb806688065ebba69a342e621434?s=128

tachyon7776

September 28, 2019
Tweet

Transcript

  1. 初心者セッション 準備~データの読込み編 @tachyon7776 Sendai.R #2

  2. 名前:外山(とやま) 慶和 twitter @tachyon7776 仕事:メーカーでデータ分析、機械学習 職業:会社員 誰? R歴:3年くらい

  3. 本セッションのゴール ・Rを使う準備、設定 ・Rについてのざっくりした理解 ・データの入出力

  4. 目次 ・Rを使う準備 ・Rの機能拡張 ・Rとは? ・データの入出力 ・Rを触ってみる ・データの種類の理解

  5. 目次 ・Rを使う準備 ・Rの機能拡張 ・Rとは? ・データの入出力 ・Rを触ってみる ・データの種類の理解

  6. Rとは? 統計解析を目的とした プログラミング言語 無償、オープンソースのソフトウェア ・データの読込み ・前処理 ・(各種の)統計解析 ・可視化 etc といったところができる

  7. 目次 ・Rを使う準備 ・Rの機能拡張 ・Rとは? ・データの入出力 ・Rを触ってみる ・データの種類の理解

  8. Rを使う準備 Rのダウンロード -> CRANにアクセス OSに応じて いずれかをクリック 日本だと統数研or山形大学にミラーサイトあり

  9. Rを使う準備 Rのダウンロード -> CRANにアクセス ここをクリック 下記はwindowsの場合

  10. Rのダウンロード -> CRANにアクセス ここからダウンロード 以前のバージョンはこっち Rを使う準備

  11. インストーラーを使ってインストール パソコンに応じて32bit or 64bitを選ぶ Rを使う準備

  12. Rstudio社が提供するRに特化した開発環境 ここからダウンロード 使わなくても問題ないけど、便利なので使用を推奨 おすすめのIDE(統合開発環境)はRStudio Rを使う準備

  13. Rを使う準備

  14. OSに応じてダウンロード ここからはRstudioをメインに話をしていきます Rを使う準備

  15. 目次 ・Rを使う準備 ・Rの機能拡張 ・Rとは? ・データの入出力 ・Rを触ってみる ・データの種類の理解

  16. Rを触ってみる RStudioを立ち上げる RStudioのアイコンをクリック -> ここをクリック

  17. Rを触ってみる RStudioの画面構成 エディター コンソール タブ1 タブ2 読み込んだデータや 処理したデータが表示される パッケージのインストールや グラフ表示など

    エディターの部分にスクリプトを書いて実行
  18. プロジェクト機能 ・各種の分析を管理できる機能 分析.Rproj 分析スクリプト.R 分析用データ.csv ・ ・ ・ 利点:分析の再現性が上がる Rを触ってみる

  19. プロジェクトの作り方 ①File -> New Project ②New Directory ③New Project ④Directory

    name入力 Rを触ってみる
  20. 目次 ・Rを使う準備 ・Rの機能拡張 ・Rとは? ・データの入出力 ・Rを触ってみる ・データの種類の理解

  21. Rの機能拡張 packageを追加することで、簡単に機能拡張が可能 →便利な手法がすぐ使える R公式のpackage →CRANに置いてある

  22. Rの機能拡張 packageの追加方法 その1 チェックを外さないこと! packageの追加方法 その2 install.packages関数を直接書く

  23. Rの機能拡張 packageの読込み その1 下記のどちらかで呼び出し requireを使った場合 packageがインストールされていればTRUE なければFALSEを返す

  24. Rの機能拡張 packageの読込み その2(参考) 使用するpackageにチェック

  25. 目次 ・Rを使う準備 ・Rの機能拡張 ・Rとは? ・データの入出力 ・Rを触ってみる ・データの種類と構造

  26. データの種類と構造 データの種類:Rが区別しているデータの扱い 1.数値 numeric:整数や実数 2.文字列 3.因子(ファクター) Character:””で囲まれた文字列 Factor:文字の裏に順序あり(1:男性、2:女性) ざっくり、下記の3つ 確認は“is.***”、変換は”as.***”

  27. データの種類と構造 データの構造:主に下記 1.ベクトル 同じデータ型を一次元でまとめたもの 2.データフレーム(重要) 3.リスト 大きさも型も異なるデータを格納 同じ長さの異なるデータ型のベクトルを テーブル形式で格納

  28. 目次 ・Rを使う準備 ・Rの機能拡張 ・Rとは? ・データの入出力 ・Rを触ってみる ・データの種類と構造

  29. データの入出力 主な読み込み方法は3つ(CSVファイル前提) 1.ベース read.csv(“file_path”) 2.パッケージ利用その1 3.パッケージ利用その3 data.table::fread.csv(“file_path”) readr::read_csv(“file_path”) havenパッケージを使うとSPSSやSASのデータも 読み込んでくれる(私は使ったことはないが・・・)

  30. データの入出力 主な出力方法 ベース write.csv(data,“file_path” row.names=FALSE) パッケージ利用 readr::write_csv(data,“file_path”) 指定しないと、行の見出しも吐き出される

  31. 最後に packageをうまく使えば、大概のことができる! 困ったときは・・・ ・help()を使う ・公式のpdfを読む ・slackのr-wakalangに質問する ・google先生に聞く ・詳しい人に聞く etc ・Rstudioのチートシートを読む

  32. Enjoy!