135 |
: |
●下から7〜3行目
JobTrackerがTaskTrackerにリクエストし、TaskTrackersが大量データのMap処理を複数のサーバーに割当てて中間結果をHDFSに暫定的に格納し、その中間結果をHDFSから呼び出し、TaskTrackersがReduce処理を行うことで最終結果を得ます。 |
 |
JobTrackerがHDFS上の大規模データを分割し、複数サーバーのTaskTrackerに処理をリクエストする形で実行します。TaskTrackersはリクエストに従い、Mapタスク、Shuffle
& Sortタスク、Reduceタスクを実行し、最終結果をHDFSに格納します。 |