首都大学東京で2014年12月に開催された「分散処理実践セミナー Apache Spark による MapReduce の基礎」の講義部分のスライドです。Jimmy Lin, Large-Scale Data Processing with MapReduce. AAAI Tutorial, 2011. の抄訳なので、基本的にはオリジナルをご参照ください。
http://www.umiacs.umd.edu/~jimmylin/cloud-computing/AAAI-2011/AAAI2011-tutorial-slides.pptx
※Apache Spark の演習部分は別スライドで、この中には入っていません。