Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
rでgoogle_analyticsデータ解析にチャレンジ #TechLunch
Search
Livesense Inc.
PRO
April 23, 2014
Technology
0
94
rでgoogle_analyticsデータ解析にチャレンジ #TechLunch
2011/05/25(水) @ Livesense TechLunch
発表者:福田 絵里
Livesense Inc.
PRO
April 23, 2014
Tweet
Share
More Decks by Livesense Inc.
See All by Livesense Inc.
27新卒_Webエンジニア職採用_会社説明資料
livesense
PRO
0
2.4k
株式会社リブセンス・転職会議 採用候補者様向け資料
livesense
PRO
0
51
株式会社リブセンス 会社説明資料(報道関係者様向け)
livesense
PRO
0
1.5k
データ基盤の負債解消のためのリプレイス
livesense
PRO
0
440
26新卒_総合職採用_会社説明資料
livesense
PRO
0
11k
株式会社リブセンス会社紹介資料 / Invent the next common.
livesense
PRO
1
37k
26新卒_Webエンジニア職採用_会社説明資料
livesense
PRO
1
13k
中途セールス職_会社説明資料
livesense
PRO
0
260
EM候補者向け転職会議説明資料
livesense
PRO
0
130
Other Decks in Technology
See All in Technology
生成AI時代のデータ基盤設計〜ペースレイヤリングで実現する高速開発と持続性〜 / Levtech Meetup_Session_2
sansan_randd
1
150
AIのグローバルトレンド2025 #scrummikawa / global ai trend
kyonmm
PRO
1
260
サンドボックス技術でAI利活用を促進する
koh_naga
0
200
Rustから学ぶ 非同期処理の仕組み
skanehira
1
130
下手な強制、ダメ!絶対! 「ガードレール」を「檻」にさせない"ガバナンス"の取り方とは?
tsukaman
2
420
ZOZOマッチのアーキテクチャと技術構成
zozotech
PRO
3
1.4k
開発者を支える Internal Developer Portal のイマとコレカラ / To-day and To-morrow of Internal Developer Portals: Supporting Developers
aoto
PRO
1
440
Automating Web Accessibility Testing with AI Agents
maminami373
0
1.2k
Terraformで構築する セルフサービス型データプラットフォーム / terraform-self-service-data-platform
pei0804
1
120
AI時代に非連続な成長を実現するエンジニアリング戦略
sansantech
PRO
3
1.2k
バイブスに「型」を!Kent Beckに学ぶ、AI時代のテスト駆動開発
amixedcolor
2
510
なぜテストマネージャの視点が 必要なのか? 〜 一歩先へ進むために 〜
moritamasami
0
210
Featured
See All Featured
Code Review Best Practice
trishagee
70
19k
Typedesign – Prime Four
hannesfritz
42
2.8k
The Invisible Side of Design
smashingmag
301
51k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Documentation Writing (for coders)
carmenintech
74
5k
The Power of CSS Pseudo Elements
geoffreycrofte
77
6k
RailsConf 2023
tenderlove
30
1.2k
What's in a price? How to price your products and services
michaelherold
246
12k
Build your cross-platform service in a week with App Engine
jlugia
231
18k
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.7k
Transcript
RでGoogleAnalyticsデータ解析 にチャレンジ Eri Fukuda 2011/05/25
Contents 目的 Rを利用して、Google Analytics Data Export APIからデータを取り出 し、ブラウザ経由からのAnalyticsでは得られない情報を出力する。 1. R言語
2. Google Analytics Data Export API 3. 実践・データ解析
1. R言語
1. R言語 グラフィックス データのグラフ・図解化機能が柔軟 (日本地図も書けちゃう!) 電卓 お手軽多機能電卓 統計 最小限の労力で、見通しよく解析するために 工夫された命令体系
1. R言語 • ベクトル処理言語 ✗ ベクトル:構造を持ったデータ集合 ✗ 構造:配列、リスト、テーブル、集合、時系列、など f1 <-
c('猫','猫','犬') f2 <- c(1, 2, 3) f <- list(field1=f1, field2=f2) f$field1 の中に "猫" "猫" "犬" f$field2 の中に 1 2 3 X <- 1:3 x の中に 1 2 3
1. R言語 • オブジェクト指向 • 多様なデータ形式に対応 • 柔軟なパッケージ管理 「CRAN」 •
単純な文法 対象ユーザー:統計処理に関わる全ての人々 • 統計学を超えた需要(金融工学・時系列分析・機械学習・データマイニ ング・バイオインフォマティクス) • 高速な処理 C、C++、FORTRANなどの外部プログラムとの動的リンク • シミュレーション 「ex. 円周率をモンテカルロ法で近似する計算」 • デメリット:デバッグ機能が乏しい テキスト, 画像, csv, SPSS, SAP, 各種データベースへのアクセス s <-100000 x <-runif(s) y <-runif(s) sum(x^2+y^2<=1)*4/s
2. Google Analytics Data Export API
2. Google Analytics Data Export API 認証 Analytics アカウント のクエリ
※認証の種類 ClientLogin : インストールするアプリケーションに適する AuthSub : ウェブアプリケーションに適する OAuth : ウェブアプリケーションに適する(API認可プロトコルの標準仕様) プロファイル のクエリ デ ー タ 出 力
• データフィードリクエスト ✔ (必須) ベースURL ✔ (必須) ids ✔ (必須)
metrics ✔ (必須) start-date, end-date ✔ (オプション) dimensions https://www.google.com/analytics/feeds/data ids=ga:12345 metrics=ga:visits, ga:timeOnSite start-date=2009-04-20 end-date=2009-05-20 dimensions=ga:browser, ga:city 2. Google Analytics Data Export API etc...
レスポンスデータが膨大な量だったら… →自動的にサンプリングが行われる ※Google Analytics は 95% の信頼水準で計算を実行。 ex) confidenceInterval=5
指標にレポートされた値が実際は推定値であるものの、その差は +/- 5% 未満 confidenceInterval=INF 計算された推定値の正確性が高くない 誤差を避け、レスポンス取得を高速するには↓ レスポンス量の制限、日付範囲を狭める、フィルタ利用 2. Google Analytics Data Export API
3. 実践・データ解析
3. 実践・データ解析 Google Analytics Data Export APIにアクセスする ためのRライブラリ 「RGoogleAnalytics.R」利用 •
対象メディア : ArbeitStock(モバイル)
3. 実践・データ解析 install.packages("RCurl", repos = "http://www.omegahat.org/R") install.packages("XML", repos = "http://www.omegahat.org/R")
source("./RGoogleAnalytics.R") source("./QueryBuilder.R") ga <- RgoogleAnalytics() options(RCurlOptions = list(capath = system.file("CurlSSL", "cacert.pem", package = "RCurl"), ssl.verifypeer = FALSE)) ga$SetCredentials("INSERT_USER_NAME", "INSERT_PASSWORD") profiles <- ga$GetProfileData() query <- QueryBuilder() query$Init(start.date = "2011-04-01", end.date = "2011-05-19", dimensions = "ga:date", metrics = "ga:visitors", sort = "ga:date", table.id = “ga:17971510”) ga.data <- ga$GetReportData(query) ga.data$data
3. 実践・データ解析 ga:date ga:visitors 1 20110401 68115 2 20110402 61374
3 20110403 61534 4 20110404 73177 5 20110405 70203 6 20110406 73578 7 20110407 70671 8 20110408 65500 9 20110409 61334 10 20110410 61900 11 20110411 70116 12 20110412 71046 13 20110413 73709 14 20110414 73057 15 20110415 67227 16 20110416 61849 17 20110417 61318 18 20110418 74123 19 20110419 75127 20 20110420 73523 21 20110421 71382 22 20110422 65705 23 20110423 59311 24 20110424 58189 25 20110425 73068 26 20110426 72271 27 20110427 69971 28 20110428 65095 29 20110429 56280 30 20110430 53978 31 20110501 51534 32 20110502 55387 33 20110503 47268 34 20110504 47388 35 20110505 51924 36 20110506 59751 37 20110507 59566 38 20110508 54855 39 20110509 78166 40 20110510 69305 41 20110511 70390 42 20110512 67156 43 20110513 67756 44 20110514 56160 45 20110515 57186 46 20110516 74349 47 20110517 72700 48 20110518 68453 49 20110519 69723 出力結果
RでGoogleAnalyticsデータ解析(実践編) 次回テーマ