

O'Reilly Media Программирование в Hive: Полное руководство по использованию хранилищ данных и языке запросов для Hadoop

Стремитесь перенести реляционное приложение базы данных на Hadoop? Это обширное руководство познакомит вас с Apache Hive, инфраструктурой хранилища данных Hadoop.
Вы быстро освоите диалект SQL Hive - HiveQL, чтобы подводить итоги, запрашивать и анализировать большие объемы данных, хранящиеся в распределенной файловой системе Hadoop.
Это руководство, основанное на примерах, покажет, как настроить и сконфигурировать Hive в вашем окружении, предоставит детальный обзор Hadoop и MapReduce, а также продемонстрирует, как Hive функционирует в экосистеме Hadoop.
Вы также найдете реальные кейсы, описывающие, как компании использовали Hive для решения уникальных задач с петабайтами данных.
Преимущества:
- Создание, изменение и удаление баз данных, таблиц, представлений, функций и индексов.
- Настройка форматов данных и параметров хранения, от файлов до внешних баз данных.
- Загрузка и извлечение данных из таблиц с использованием запросов, группировок, фильтрации, объединения и других традиционных методов запросов.
- Лучшие практики для создания определенных пользователями функций (UDF).
- Изучите шаблоны Hive, которые следует использовать, и шаблоны, которых следует избегать.
- Интеграция Hive с другими программами обработки данных.
- Использование обработчиков хранения для NoSQL баз данных и других хранилищ данных.
- Преимущества и недостатки работы Hive на Amazon Elastic MapReduce.
https://usmall.ru/image/000/00/00/ff72e0c26472e83844561306506bd0b2.jpeg
O'Reilly Media
Программирование в Hive: Полное руководство по использованию хранилищ данных и языке запросов для Hadoop
4 410 ₽





















































































































































