Практическое руководство по управлению сущностями: Эффективное сопоставление данных с использованием Python и облачных API O'Reilly Media

O'Reilly Media Практическое руководство по управлению сущностями: Эффективное сопоставление данных с использованием Python и облачных API

0
13876608
Цвет: Нет цвета (NOCOLOR)
Нет цвета (NOCOLOR)
Размер: Paperback
Описание товара
/

Разрешение сущностей — это ключевая аналитическая техника, позволяющая выявлять множественные записи данных, относящиеся к одной и той же сущности в реальном мире.

С этим практическим руководством, менеджеры продуктов, аналитики данных и ученые-данные научатся добавлять ценность к данным, очищая, анализируя и разрешая наборы данных с использованием библиотек Python с открытым исходным кодом и облачных API.

Автор Майкл Ширер демонстрирует, как масштабировать процессы сопоставления данных и улучшать точность согласования данных. Вы сможете удалить дубликаты из одного источника и объединить различные источники данных, когда общие ключи отсутствуют.

С помощью реальных примеров данных эта книга помогает получить практическое понимание для ускорения предоставления реальной бизнес-ценности.

Используя разрешение сущностей, вы создадите богатые и комплексные базы данных, раскрывающие взаимосвязи для целей маркетинга и управления рисками, что является ключом к полному использованию потенциала машинного обучения и ИИ.

Книга охватывает:

  • Проблемы дублирования и объединения наборов данных
  • Извлечение, очистка и подготовка наборов данных для сопоставления
  • Алгоритмы текстового сопоставления для выявления эквивалентных сущностей
  • Техники дублирования и объединения наборов данных в больших объемах
  • Сопоставление наборов данных, содержащих людей и организации
  • Оценка соответствия данных
  • Оптимизация и настройка алгоритмов сопоставления данных
  • Разрешение сущностей с использованием облачных API
  • Сопоставление с применением технологий повышения конфиденциальности

5 040 ₽ С промокодом ПЕРВОЦВЕТ Без: 6 720 ₽