Slide 58
Slide 58 text
「ペア」から「ストライプ」へ
¢ アイデア: ペアを連想配列にグループ化する
¢ 各 mapper は文を引数に取る。
l 共起する単語ペアを全て生成する
l 各単語に対し、emit a → { b: countb
, c: countc
, d: countd
… }
¢ reducer は連想配列の要素ごとの合計を計算
(a, b) → 1
(a, c) → 2
(a, d) → 5
(a, e) → 3
(a, f) → 2
a → { b: 1, c: 2, d: 5, e: 3, f: 2 }
a → { b: 1, d: 5, e: 3 }
a → { b: 1, c: 2, d: 2, f: 2 }
a → { b: 2, c: 2, d: 7, e: 3, f: 2 }
+
ポイント: 賢く構築されたデータ構造
と部分的な結果を組み合わせる