Apache Iceberg: Полное руководство по функциональности, производительности и масштабируемости Data Lakehouse O'Reilly Media

O'Reilly Media Apache Iceberg: Полное руководство по функциональности, производительности и масштабируемости Data Lakehouse

0
13859263
Цвет: Нет цвета (NOCOLOR)
Нет цвета (NOCOLOR)
Размер: Paperback
Описание товара
/

Традиционные паттерны архитектуры данных сильно ограничены. Для их использования требуется ETL данных в каждый инструмент, что является затратным процессом для доступа ко всем данным в хранилище.

Отсутствие гибкости этих паттернов заставляет вас зафиксироваться на ограниченном наборе инструментов и форматов, что создает изолированные данные и их расхождение.

Эта практическая книга демонстрирует лучшие подходы. Apache Iceberg предлагает возможности, производительность, масштабируемость и экономию, которые реализуют обещания открытого Data Lakehouse.

С помощью уроков из этой книги вы научитесь проводить интерактивный, пакетный, машинный анализ и потоковую аналитику с помощью этого высокопроизводительного открытого формата.

Авторы Томер Ширан, Джейсон Хьюз и Алекс Мерсед из Dremio покажут, как начать работу с Iceberg.

В этой книге вы узнаете:

  • Архитектура таблиц Apache Iceberg
  • Что происходит «за кулисами» при выполнении операций с таблицами Iceberg
  • Как оптимизировать таблицы Iceberg для максимальной производительности
  • Как использовать Iceberg с популярными движками данных, такими как Apache Spark, Apache Flink и Dremio

Узнайте, почему Apache Iceberg является основополагающей технологией для реализации открытого Data Lakehouse.

4 880 ₽ С промокодом АПРЕЛЬ Без: 6 500 ₽