Методы распределенной обработки больших объемов данных в Hadoop. Лекция 4. MapReduce в Hadoop (введение). Романенко Алексей

544

Романенко Алексей рассказывает о MapReduce в Hadoop.

  1. Рабочий процесс MapReduce
  2. Hadoop MapReduce и HDFS
  3. Выполнение MapReduce
  4. Архитектура и работа первой версии MapReduce
  5. Hadoop API (типы, классы)
  6. WordCount (Congigure Job, Mapper, Reducer)
  7. Reducer в качестве Combiner
  8. Типы данных в Hadoop
  9. InputSplit, InputFormat, OutputFormat
  10. Shuffle и Sort в Hadoop
  11. Запуск и отладка задач
  12. Hadoop Streaming
  13. Streaming в MapReduce