

O'Reilly Media Практическое руководство по управлению сущностями: Эффективное сопоставление данных с использованием Python и облачных API

Разрешение сущностей — это ключевая аналитическая техника, позволяющая выявлять множественные записи данных, относящиеся к одной и той же сущности в реальном мире.
С этим практическим руководством, менеджеры продуктов, аналитики данных и ученые-данные научатся добавлять ценность к данным, очищая, анализируя и разрешая наборы данных с использованием библиотек Python с открытым исходным кодом и облачных API.
Автор Майкл Ширер демонстрирует, как масштабировать процессы сопоставления данных и улучшать точность согласования данных. Вы сможете удалить дубликаты из одного источника и объединить различные источники данных, когда общие ключи отсутствуют.
С помощью реальных примеров данных эта книга помогает получить практическое понимание для ускорения предоставления реальной бизнес-ценности.
Используя разрешение сущностей, вы создадите богатые и комплексные базы данных, раскрывающие взаимосвязи для целей маркетинга и управления рисками, что является ключом к полному использованию потенциала машинного обучения и ИИ.
Книга охватывает:
- Проблемы дублирования и объединения наборов данных
- Извлечение, очистка и подготовка наборов данных для сопоставления
- Алгоритмы текстового сопоставления для выявления эквивалентных сущностей
- Техники дублирования и объединения наборов данных в больших объемах
- Сопоставление наборов данных, содержащих людей и организации
- Оценка соответствия данных
- Оптимизация и настройка алгоритмов сопоставления данных
- Разрешение сущностей с использованием облачных API
- Сопоставление с применением технологий повышения конфиденциальности
https://usmall.ru/image/000/00/00/4e1c5e47f261bb62ac7de51ff077ddfb.jpeg
O'Reilly Media
Практическое руководство по управлению сущностями: Эффективное сопоставление данных с использованием Python и облачных API
6 720 ₽





















































































































































