Изучаем Spark: Быстрая аналитика данных, обновленное издание для Spark 3.0 с акцентом на изучение Python, SQL, Scala и Java O'Reilly Media

O'Reilly Media Изучаем Spark: Быстрая аналитика данных, обновленное издание для Spark 3.0 с акцентом на изучение Python, SQL, Scala и Java

Name: Изучаем Spark: Быстрая аналитика данных, обновленное издание для Spark 3.0 с акцентом на изучение Python, SQL, Scala и Java
Brand: O'Reilly Media
SKU: 13849212
Price: 4780 RUB
Availability: InStock

13849212

Цвет: Нет цвета (NOCOLOR)

Размер: Paperback

Paperback

Описание товара

Данные становятся все больше, поступают быстрее и представлены в различных форматах, и все это нужно обрабатывать в больших объемах для аналитики или машинного обучения.

Однако как эффективно обрабатывать такие разнообразные рабочие нагрузки? Здесь на помощь приходит Apache Spark.

Эта обновленная вторая редакция книги показывает специалистам по данным, почему структура и унификация в Spark имеют значение.

В книге объясняется, как выполнять простую и сложную аналитику данных и использовать алгоритмы машинного обучения.

Благодаря пошаговым инструкциям, фрагментам кода и блокнотам вы сможете:

Изучить высокоуровневые API на Python, SQL, Scala или Java.
Понять операции Spark и SQL Engine.
Проверить, настроить и отладить операции Spark с помощью конфигураций и интерфейса Spark.
Подключиться к источникам данных: JSON, Parquet, CSV, Avro, ORC, Hive, S3 или Kafka.
Проводить аналитику как на пакетных, так и на потоковых данных с использованием Structured Streaming.
Создавать надежные пайплайны данных с использованием открытого Delta Lake и Spark.
Разрабатывать пайплайны машинного обучения с помощью MLlib и переводить модели в продуктив.

4 780 ₽ С промокодом АПРЕЛЬ Без: 6 370 ₽

Продавец Amazon

Другие компьютерные технологии Бренда O'Reilly Media Все товары Бренда O'Reilly Media Все компьютерные технологии Категория