Программирование в Hive: Полное руководство по использованию хранилищ данных и языке запросов для Hadoop O'Reilly Media

O'Reilly Media Программирование в Hive: Полное руководство по использованию хранилищ данных и языке запросов для Hadoop

0
13877574
Цвет: Нет цвета (NOCOLOR)
Нет цвета (NOCOLOR)
Размер: Paperback
Описание товара
/

Стремитесь перенести реляционное приложение базы данных на Hadoop? Это обширное руководство познакомит вас с Apache Hive, инфраструктурой хранилища данных Hadoop.

Вы быстро освоите диалект SQL Hive - HiveQL, чтобы подводить итоги, запрашивать и анализировать большие объемы данных, хранящиеся в распределенной файловой системе Hadoop.

Это руководство, основанное на примерах, покажет, как настроить и сконфигурировать Hive в вашем окружении, предоставит детальный обзор Hadoop и MapReduce, а также продемонстрирует, как Hive функционирует в экосистеме Hadoop.

Вы также найдете реальные кейсы, описывающие, как компании использовали Hive для решения уникальных задач с петабайтами данных.

Преимущества:

  • Создание, изменение и удаление баз данных, таблиц, представлений, функций и индексов.
  • Настройка форматов данных и параметров хранения, от файлов до внешних баз данных.
  • Загрузка и извлечение данных из таблиц с использованием запросов, группировок, фильтрации, объединения и других традиционных методов запросов.
  • Лучшие практики для создания определенных пользователями функций (UDF).
  • Изучите шаблоны Hive, которые следует использовать, и шаблоны, которых следует избегать.
  • Интеграция Hive с другими программами обработки данных.
  • Использование обработчиков хранения для NoSQL баз данных и других хранилищ данных.
  • Преимущества и недостатки работы Hive на Amazon Elastic MapReduce.
3 310 ₽ С промокодом ПЕРВОЦВЕТ Без: 4 410 ₽