Методы распределенной обработки больших объемов данных в Hadoop. Лекция 7. Введение в Pig и Hive. Романенко Алексей

892

Романенко Алексей рассказывает о платформе для анализа больших коллекций данных, состоящей из языка высокого уровня и инфраструктуры для запуска программ и о Hive.

  1. Pig
  2. Pig & MapReduce
  3. Основные возможности Pig
  4. Компоненты Pig
  5. Режимы выполнения
  6. Запуск Pig
  7. Pig Latin
  8. Простой пример Pig Latin
  9. Операции DUMP & Store
  10. Большой объем данных
  11. Команда LOAD
  12. Типы данных для схемы
  13. Pig Latin: средства диагностики
  14. Pig Latin: группировка
  15. Pig Latin: FOREACH
  16. Pig Latin: функция TOKENIZE
  17. Pig Latin: оператор FLATTEN
  18. Pig Latin: WordCount
  19. Pig Latin: Joins
  20. Inner Join, пример
  21. Pig Latin: Outer Join
  22. Left Outer Join
  23. Hive
  24. Архитектура Hive
  25. Hive интерфейс
  26. Концепция Hive
  27. Hive: создание таблицы
  28. Hive: загрузка данных
  29. Hive: выполнение запроса
  30. Hive: удаление таблицы
  31. Hive: нарушение системы
  32. Hive: Joins
  33. Hive: Inner Join
  34. Hive: Outer Join
  35. Hive: WordCount