Методы распределенной обработки больших объемов данных в Hadoop. Лекция 3. Распределенная файловая система HDFS. Романенко Алексей

637

Романенко Алексей рассказывает о распределенной файловой системе.

  1. Задачи, для которых подходит и не подходит HDFS
  2. Демоны HDFS
  3. Файлы и блоки
  4. Репликация блоков
  5.  Клиенты, Namenode и Datanodes
  6. Чтение и запись файла
  7. Namenode: использование памяти
  8. Устойчивость к отказам в Namenode
  9. Доступ к HDFS, в том числе через прокси
  10. Команды оболочки shell
  11. Копирование данных в shell, удаление и статистика
  12. Команда fsck
  13. Права в HDFS
  14. Команда DFSAdmin
  15. Балансер
  16. File System Java API
  17. Реализация File System
  18. Объект Configuration
  19. Чтение данных из файла и запись в него
  20. Подстановки (globbing)