Googleでは簡単な データ解析にMapReduce は使いません 使うのはDremel = Google BigQuery SELECT top(appId, 20) AS app, count(*) AS count FROM installlog.2012 ORDER BY count DESC 20秒で1000億行をスキャン可能 インデックスは不使用
例: 1000億行に対するRegEx + GROUP BY SELECT language, SUM(views) as views FROM ( SELECT title, language, MAX(views) as views FROM [helixdata2:benchmark.Wiki100B] WHERE REGEXP_MATCH(title, "G.*o.*") GROUP EACH BY title, language ) GROUP EACH BY language ORDER BY views desc
ミキサー0 ミキサー1 ミキサー1 シャード シャード シャード シャード ColumnIO on Colossus SELECT state, year COUNT(*) GROUP BY state WHERE year >= 1980 and year < 1990 ORDER BY count_babies DESC LIMIT 10 COUNT(*) GROUP BY state ツリー構造による高速アグリゲーション
BigQuery Analytic Service in the Cloud BigQuery Google アナリティクス 解析 エクスポート インポート インポート、解析、エクスポート ETLツール コネクター BIツールと可視化 Googleクラウド Googleクラウド スプレッドシート、R、 Hadoop