Методы распределенной обработки больших объемов данных в Hadoop. Лекция 2. Основы Hadoop. Романенко Алексей

806

Романенко Алексей рассказывает об основах Hadoop, истории и его применении. Говорит об экосистеме Hadoop.

  1. История Hadoop и его применение
  2. Хранение данных, кластер Hadoop
  3. Системные принципы
  4. Горизонтальное масштабирование вместо вертикального
  5. Код к данным
  6. Отказы оборудования
  7. Инкапсуляция сложности реализации
  8. Сравнение с СУБД (RDBMS)
  9. Экосистема Hadoop
  10. Дистрибутивы, вендоры, поддерживаемые ОС
  11. Полезная литература
  12. Hadoop на Cloudera VM
  13. Импорт и запуск VM
  14. Копирование файлов в HDFS
  15. Запуск MapReduce-задачи в Hadoop
  16. Проверка результатов