Дедупликация: рекомендации по предотвращению или исправлению дублирования данных клиентов

Рекомендации по дедупликации данных для CRM

Дублирующиеся данные не только снижают точность бизнес-аналитики, но и ухудшают качество обслуживания клиентов. Хотя с последствиями дублирования данных сталкиваются все - ИТ-менеджеры, бизнес-пользователи, аналитики данных, - он оказывает наихудшее влияние на маркетинговые операции компании. Поскольку маркетологи представляют продукты и услуги компании в отрасли, некачественные данные могут быстро испортить репутацию вашего бренда и привести к негативному восприятию клиентов. Дублирование данных в CRM компании происходит по разным причинам.

От человеческой ошибки до клиентов, предоставляющих немного разную информацию в разные моменты времени в базе данных организации. Например, потребитель указывает свое имя как Джонатан Смит в одной форме и Джон Смит - в другой. Проблема усугубляется растущей базой данных. Администраторам часто становится все труднее отслеживать БД, а также отслеживать соответствующие данные. Становится все более сложной задачей обеспечить точность базы данных организации ».

Натик Амин, эксперт по маркетингу в Канц Маркетинг

В этой статье мы рассмотрим различные типы повторяющихся данных и некоторые полезные стратегии, которые маркетологи могут использовать для дедупликации баз данных своей компании.

Различные типы повторяющихся данных

Дубликаты данных обычно объясняются копией оригинала. Но есть разные типы повторяющихся данных, которые усложняют эту проблему.

  1. Точные дубликаты в том же источнике - Это происходит, когда записи из одного источника данных переносятся в другой источник данных без учета каких-либо методов сопоставления или слияния. Примером может служить копирование информации из CRM в инструмент электронного маркетинга. Если ваш клиент подписался на ваш информационный бюллетень, значит, его запись уже присутствует в инструменте электронного маркетинга, и при передаче данных из CRM в инструмент будут созданы дубликаты одной и той же сущности. 
  2. Точные дубликаты в нескольких источниках - Точные дубликаты в нескольких источниках обычно возникают из-за инициатив по резервному копированию данных в компании. Организации склонны сопротивляться действиям по очистке данных и склонны хранить все копии данных, которые у них есть под рукой. Это приводит к разрозненным источникам, содержащим повторяющуюся информацию.
  3. Различные дубликаты в нескольких источниках - Могут существовать дубликаты с различной информацией. Обычно это происходит, когда клиенты меняют фамилию, должность, компанию, адрес электронной почты и т. Д. А поскольку между старыми и новыми записями есть заметные различия, входящая информация рассматривается как новая сущность.
  4. Неточные дубликаты в одном или нескольких источниках - Неточный дубликат - это когда значение данных означает одно и то же, но представлено по-разному. Например, имя Дона Джейн Рут может быть сохранено как Дона Дж. Рут или DJ Рут. Все значения данных представляют собой одно и то же, но при сравнении с помощью простых методов сопоставления данных они считаются несовпадающими.

Дедупликация может быть очень сложным процессом, поскольку потребители и компании часто со временем изменяют свои контактные данные. Есть различия в том, как они вводят каждое поле данных - от своего имени, адреса (а) электронной почты, адреса проживания, адреса предприятия и т. Д.

Вот список из 5 лучших практик дедупликации данных, которые маркетологи могут начать использовать уже сегодня.

Стратегия 1: проверка ввода данных

У вас должен быть строгий контроль валидации на всех сайтах ввода данных. Это включает в себя обеспечение того, чтобы входные данные соответствовали требуемому типу данных, формату и находились в допустимых диапазонах. Это может иметь большое значение для обеспечения полноты, достоверности и точности ваших данных. Кроме того, очень важно, чтобы ваш рабочий процесс ввода данных не только был настроен на создание новых записей, но и сначала выполнял поиск и обнаруживал, содержит ли набор данных существующую запись, совпадающую с входящей. И в таких случаях он только находит и обновляет, а не создает новую запись. Многие компании внедрили проверки для клиентов, чтобы устранить свои собственные дублирующиеся данные.

Стратегия 2: выполнение дедупликации с помощью автоматических инструментов

Воспользуйтесь самообслуживанием ПО для дедупликации данных которые могут помочь вам в выявлении и очистке повторяющихся записей. Эти инструменты могут стандартизировать данные, точно находят точные и неточные совпадения, а также сокращают ручной труд по просмотру тысяч строк данных. Убедитесь, что инструмент поддерживает импорт данных из самых разных источников, таких как таблицы Excel, база данных CRM, списки и т. Д.

Стратегия 3. Использование методов дедупликации для конкретных данных

В зависимости от характера данных дедупликация данных выполняется по-разному. Маркетологи должны быть осторожны при дедупликации данных, потому что одно и то же может означать что-то разное для разных атрибутов данных. Например, если на адресе электронной почты совпадают две записи данных, то с высокой вероятностью они дублируются. Но если две записи совпадают по адресу, то это не обязательно дубликат, потому что два человека, принадлежащие к одному домохозяйству, могут иметь разные подписки в вашей компании. Поэтому обязательно реализуйте действия по дедупликации, слиянию и очистке данных в соответствии с типом данных, которые содержатся в ваших наборах данных.

Стратегия 4: достижение золотого мастер-рекорда за счет обогащения данных

После того, как вы определили список совпадений, которые существуют в вашей базе данных, крайне важно проанализировать эту информацию, прежде чем можно будет принять решение об объединении или очистке данных. Если для одного объекта существует несколько записей, а некоторые из них представляют неточную информацию, то лучше удалить эти записи. С другой стороны, если дубликаты неполные, то объединение данных - лучший выбор, поскольку оно позволит обогащать данные, а объединенные записи могут повысить ценность вашего бизнеса. 

В любом случае маркетологи должны работать над достижением единого представления о своей маркетинговой информации, которое называется золотой мастер-рекорд.

Стратегия 5: Мониторинг показателей качества данных

Постоянные усилия по поддержанию чистоты и дедупликации ваших данных - лучший способ реализовать вашу стратегию дедупликации данных. Здесь может быть очень полезен инструмент, который предлагает функции профилирования данных и управления качеством. Маркетологам необходимо следить за тем, насколько точными, достоверными, полными, уникальными и последовательными являются данные, которые используются для маркетинговых операций.

Поскольку организации продолжают добавлять приложения для обработки данных в свои бизнес-процессы, у каждого маркетолога возникла необходимость иметь стратегии дедупликации данных. Такие инициативы, как использование инструментов дедупликации данных и разработка более эффективных рабочих процессов проверки для создания и обновления записей данных, - вот некоторые важные стратегии, которые могут обеспечить надежное качество данных в вашей организации.

О лестнице данных

Data Ladder - это платформа управления качеством данных, которая помогает компаниям очищать, классифицировать, стандартизировать, дедуплицировать, профилировать и обогащать свои данные. Наше ведущее в отрасли программное обеспечение для сопоставления данных помогает вам находить совпадающие записи, объединять данные и удалять дубликаты с помощью интеллектуальных алгоритмов нечеткого сопоставления и машинного обучения, независимо от того, где находятся ваши данные и в каком формате.

Загрузите бесплатную пробную версию программного обеспечения для сопоставления данных Data Ladder

Как вы думаете?

Этот сайт использует Akismet для уменьшения количества спама. Узнайте, как обрабатываются ваши данные комментариев.