

O'Reilly Media Apache Iceberg: Полное руководство по функциональности, производительности и масштабируемости Data Lakehouse

Традиционные паттерны архитектуры данных сильно ограничены. Для их использования требуется ETL данных в каждый инструмент, что является затратным процессом для доступа ко всем данным в хранилище.
Отсутствие гибкости этих паттернов заставляет вас зафиксироваться на ограниченном наборе инструментов и форматов, что создает изолированные данные и их расхождение.
Эта практическая книга демонстрирует лучшие подходы. Apache Iceberg предлагает возможности, производительность, масштабируемость и экономию, которые реализуют обещания открытого Data Lakehouse.
С помощью уроков из этой книги вы научитесь проводить интерактивный, пакетный, машинный анализ и потоковую аналитику с помощью этого высокопроизводительного открытого формата.
Авторы Томер Ширан, Джейсон Хьюз и Алекс Мерсед из Dremio покажут, как начать работу с Iceberg.
В этой книге вы узнаете:
- Архитектура таблиц Apache Iceberg
- Что происходит «за кулисами» при выполнении операций с таблицами Iceberg
- Как оптимизировать таблицы Iceberg для максимальной производительности
- Как использовать Iceberg с популярными движками данных, такими как Apache Spark, Apache Flink и Dremio
Узнайте, почему Apache Iceberg является основополагающей технологией для реализации открытого Data Lakehouse.
https://usmall.ru/image/000/00/00/b7679e879e866641b9461d2ef2304291.jpeg
O'Reilly Media
Apache Iceberg: Полное руководство по функциональности, производительности и масштабируемости Data Lakehouse
6 500 ₽





















































































































































