Изучаем Spark: Быстрая аналитика данных, обновленное издание для Spark 3.0 с акцентом на изучение Python, SQL, Scala и Java O'Reilly Media

O'Reilly Media Изучаем Spark: Быстрая аналитика данных, обновленное издание для Spark 3.0 с акцентом на изучение Python, SQL, Scala и Java

0
13849212
Цвет: Нет цвета (NOCOLOR)
Нет цвета (NOCOLOR)
Размер: Paperback
Описание товара
/

Данные становятся все больше, поступают быстрее и представлены в различных форматах, и все это нужно обрабатывать в больших объемах для аналитики или машинного обучения.

Однако как эффективно обрабатывать такие разнообразные рабочие нагрузки? Здесь на помощь приходит Apache Spark.

Эта обновленная вторая редакция книги показывает специалистам по данным, почему структура и унификация в Spark имеют значение.

В книге объясняется, как выполнять простую и сложную аналитику данных и использовать алгоритмы машинного обучения.

Благодаря пошаговым инструкциям, фрагментам кода и блокнотам вы сможете:

  • Изучить высокоуровневые API на Python, SQL, Scala или Java.
  • Понять операции Spark и SQL Engine.
  • Проверить, настроить и отладить операции Spark с помощью конфигураций и интерфейса Spark.
  • Подключиться к источникам данных: JSON, Parquet, CSV, Avro, ORC, Hive, S3 или Kafka.
  • Проводить аналитику как на пакетных, так и на потоковых данных с использованием Structured Streaming.
  • Создавать надежные пайплайны данных с использованием открытого Delta Lake и Spark.
  • Разрабатывать пайплайны машинного обучения с помощью MLlib и переводить модели в продуктив.
4 780 ₽ С промокодом АПРЕЛЬ Без: 6 370 ₽