時系列列データ処理理: – リアルタイムに結果を得る • 利利⽤用例例 – ソーシャルネットワークの トレンド – Web サイト統計、監視 – 不不正検知 – 広告クリック課⾦金金 put put put put Time stamped data data • センサー、システムメトリクス、イベント、ログファイル • ストックティッカー、ユーザーアクティビティ • ⼤大容量量、⾼高頻度度 Data for real-time monitoring
= new StreamingContext(sparkConf, Seconds(2)) val linesDStream = ssc.textFileStream("/mapr/stream") batch time 0-1 linesDStream batch time 1-2 batch time 1-2 DStream: データストリームを表す 連続したRDD RDD としてメモリ上に 格納される
Put オブジェクトを HBase に書き出す batch time 0-1 linesRDD DStream sensorRDD DStream batch time 1-2 map map batch time 1-2 HBase save save save 出⼒力力オペレーション: 外部ストレージにデータを永続化