Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
rでgoogle_analyticsデータ解析にチャレンジ #TechLunch
Search
Livesense Inc.
PRO
April 23, 2014
Technology
0
79
rでgoogle_analyticsデータ解析にチャレンジ #TechLunch
2011/05/25(水) @ Livesense TechLunch
発表者:福田 絵里
Livesense Inc.
PRO
April 23, 2014
Tweet
Share
More Decks by Livesense Inc.
See All by Livesense Inc.
中途セールス職_会社説明資料
livesense
PRO
0
2
EM候補者向け転職会議説明資料
livesense
PRO
0
9
コロナで失われたノベルティ作成ノウハウを復活させた話
livesense
PRO
0
82
株式会社リブセンス 会社説明資料(報道関係者様向け)
livesense
PRO
0
370
転職会議でGPT-3を活用した企業口コミ要約機能をリリースした話
livesense
PRO
0
1.1k
株式会社リブセンス マッハバイト_プレイブック
livesense
PRO
0
420
Tech Award 2021 選出方法
livesense
PRO
0
1k
株式会社リブセンス エンジニアリング組織を支える風土と制度
livesense
PRO
0
540
株式会社リブセンス・マッハバイト 採用候補者様向け資料
livesense
PRO
0
210
Other Decks in Technology
See All in Technology
Handling focus in 2024
tahia910
0
480
20分で完全に理解するGrafanaダッシュボード
hamadakoji
5
970
LLM開発・活用の舞台裏@2024.04.25
yushin_n
3
1.3k
ExaDB-D dbaascli で出来ること
oracle4engineer
PRO
0
2.1k
MLOpsの「壁」を乗り越える、LINEヤフーの Data Quality as Code
lycorptech_jp
PRO
8
670
Autonomous Database Cloud 技術詳細 / adb-s_technical_detail_jp
oracle4engineer
PRO
15
35k
M5と自作基板をくっつけてみた〜M5 Japan Tour 2024 Spring 福冈 (Fukuoka|福岡)〜
keropiyo
0
220
いいたいことちゃんという
tkengo
0
260
しくじり先生、PharmaXのLLMアプリケーション開発の失敗を語る
pharma_x_tech
0
110
DX企業CTOとして考える技術への向き合い方
shoheitai
0
100
Oracle Base Database Service 技術詳細
oracle4engineer
PRO
5
37k
さらばあのボタンとは言わせない SORACOM LTE-M Button powerd by AWSをまだ使えるようにした(前編?)
miura55
0
100
Featured
See All Featured
Unsuck your backbone
ammeep
664
57k
GitHub's CSS Performance
jonrohan
1025
450k
10 Git Anti Patterns You Should be Aware of
lemiorhan
649
58k
In The Pink: A Labor of Love
frogandcode
138
21k
The Invisible Side of Design
smashingmag
294
49k
Into the Great Unknown - MozCon
thekraken
15
1k
Atom: Resistance is Futile
akmur
260
25k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
352
28k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
123
39k
BBQ
matthewcrist
80
8.8k
Art, The Web, and Tiny UX
lynnandtonic
290
19k
What’s in a name? Adding method to the madness
productmarketing
PRO
17
2.7k
Transcript
RでGoogleAnalyticsデータ解析 にチャレンジ Eri Fukuda 2011/05/25
Contents 目的 Rを利用して、Google Analytics Data Export APIからデータを取り出 し、ブラウザ経由からのAnalyticsでは得られない情報を出力する。 1. R言語
2. Google Analytics Data Export API 3. 実践・データ解析
1. R言語
1. R言語 グラフィックス データのグラフ・図解化機能が柔軟 (日本地図も書けちゃう!) 電卓 お手軽多機能電卓 統計 最小限の労力で、見通しよく解析するために 工夫された命令体系
1. R言語 • ベクトル処理言語 ✗ ベクトル:構造を持ったデータ集合 ✗ 構造:配列、リスト、テーブル、集合、時系列、など f1 <-
c('猫','猫','犬') f2 <- c(1, 2, 3) f <- list(field1=f1, field2=f2) f$field1 の中に "猫" "猫" "犬" f$field2 の中に 1 2 3 X <- 1:3 x の中に 1 2 3
1. R言語 • オブジェクト指向 • 多様なデータ形式に対応 • 柔軟なパッケージ管理 「CRAN」 •
単純な文法 対象ユーザー:統計処理に関わる全ての人々 • 統計学を超えた需要(金融工学・時系列分析・機械学習・データマイニ ング・バイオインフォマティクス) • 高速な処理 C、C++、FORTRANなどの外部プログラムとの動的リンク • シミュレーション 「ex. 円周率をモンテカルロ法で近似する計算」 • デメリット:デバッグ機能が乏しい テキスト, 画像, csv, SPSS, SAP, 各種データベースへのアクセス s <-100000 x <-runif(s) y <-runif(s) sum(x^2+y^2<=1)*4/s
2. Google Analytics Data Export API
2. Google Analytics Data Export API 認証 Analytics アカウント のクエリ
※認証の種類 ClientLogin : インストールするアプリケーションに適する AuthSub : ウェブアプリケーションに適する OAuth : ウェブアプリケーションに適する(API認可プロトコルの標準仕様) プロファイル のクエリ デ ー タ 出 力
• データフィードリクエスト ✔ (必須) ベースURL ✔ (必須) ids ✔ (必須)
metrics ✔ (必須) start-date, end-date ✔ (オプション) dimensions https://www.google.com/analytics/feeds/data ids=ga:12345 metrics=ga:visits, ga:timeOnSite start-date=2009-04-20 end-date=2009-05-20 dimensions=ga:browser, ga:city 2. Google Analytics Data Export API etc...
レスポンスデータが膨大な量だったら… →自動的にサンプリングが行われる ※Google Analytics は 95% の信頼水準で計算を実行。 ex) confidenceInterval=5
指標にレポートされた値が実際は推定値であるものの、その差は +/- 5% 未満 confidenceInterval=INF 計算された推定値の正確性が高くない 誤差を避け、レスポンス取得を高速するには↓ レスポンス量の制限、日付範囲を狭める、フィルタ利用 2. Google Analytics Data Export API
3. 実践・データ解析
3. 実践・データ解析 Google Analytics Data Export APIにアクセスする ためのRライブラリ 「RGoogleAnalytics.R」利用 •
対象メディア : ArbeitStock(モバイル)
3. 実践・データ解析 install.packages("RCurl", repos = "http://www.omegahat.org/R") install.packages("XML", repos = "http://www.omegahat.org/R")
source("./RGoogleAnalytics.R") source("./QueryBuilder.R") ga <- RgoogleAnalytics() options(RCurlOptions = list(capath = system.file("CurlSSL", "cacert.pem", package = "RCurl"), ssl.verifypeer = FALSE)) ga$SetCredentials("INSERT_USER_NAME", "INSERT_PASSWORD") profiles <- ga$GetProfileData() query <- QueryBuilder() query$Init(start.date = "2011-04-01", end.date = "2011-05-19", dimensions = "ga:date", metrics = "ga:visitors", sort = "ga:date", table.id = “ga:17971510”) ga.data <- ga$GetReportData(query) ga.data$data
3. 実践・データ解析 ga:date ga:visitors 1 20110401 68115 2 20110402 61374
3 20110403 61534 4 20110404 73177 5 20110405 70203 6 20110406 73578 7 20110407 70671 8 20110408 65500 9 20110409 61334 10 20110410 61900 11 20110411 70116 12 20110412 71046 13 20110413 73709 14 20110414 73057 15 20110415 67227 16 20110416 61849 17 20110417 61318 18 20110418 74123 19 20110419 75127 20 20110420 73523 21 20110421 71382 22 20110422 65705 23 20110423 59311 24 20110424 58189 25 20110425 73068 26 20110426 72271 27 20110427 69971 28 20110428 65095 29 20110429 56280 30 20110430 53978 31 20110501 51534 32 20110502 55387 33 20110503 47268 34 20110504 47388 35 20110505 51924 36 20110506 59751 37 20110507 59566 38 20110508 54855 39 20110509 78166 40 20110510 69305 41 20110511 70390 42 20110512 67156 43 20110513 67756 44 20110514 56160 45 20110515 57186 46 20110516 74349 47 20110517 72700 48 20110518 68453 49 20110519 69723 出力結果
RでGoogleAnalyticsデータ解析(実践編) 次回テーマ