Etape clé d’une stratégie marketing orientée Data Quality, le nettoyage des bases de données a pour objectif l’amélioration constante de l’exactitude des informations contenues dans une database. Cette opération repose sur deux actions distinctes : l’identification des données non qualitatives et leur correction au sein de la base.

 

1. L’identification des données non qualitatives

La notion de « donnée non qualitative » se réfère bien sûr en premier lieu à des données erronées.

Elle renferme néanmoins un spectre beaucoup plus large. Il peut aussi s’agir de :

  • données incomplètes rendant leur utilisation automatisée impossible (ex. le numéro de téléphone de la filiale étrangère d’un client auquel il manque l’indicatif du pays),
  • données inutiles ayant pour effet de parasiter le bon usage du fichier (ex. l’ancienne adresse email d’un prospect, demeurée dans le fichier aux cotés de l’actuelle),
  • données doublons, dérive très courante au sein d’une base renseignée via divers canaux,
  • données exactes dans l’absolu, mais incohérentes du point de vue de leur exploitation commerciale (ex. le numéro de téléphone du siège social d’une société, relié à l’adresse postale de l’une des ses filiales),
  • données brutes exactes mais présentées incorrectement par rapport aux normes de la database (ex. le nom de famille placé avant le prénom ; le genre féminin apparaissant sous la forme « F » alors que le standard retenu est « Mme »).
  • données mal retranscrites du fait d’incompatibilités informatiques (ex le plus courant : les lettres avec accents remplacées par des caractères abscons).

 

2. La correction des données non qualitatives au sein de la base

Data Quality | Nettoyage des basesBien que la technologie Big Data s’efforce – avec une pertinence en constante augmentation – de fournir uniquement des données qualitatives, un tel afflux d’informations en un temps record ne peut échapper à toute une série d’erreurs, imprécisions et autres redondances. En outre, il n’est pas toujours possible d’avoir le contrôle sur le format et le type de données importées de sources diverses. Si l’identification et la correction des bugs ont toujours constitué une tâche importante pour les départements marketing et commerciaux, elles prennent donc une dimension encore plus stratégique à l’heure du Big Data.

Ceci précisé, reste à mettre en œuvre l’opération du nettoyage des bases de données clients. En B to B où le nombre moyen de prospects excède rarement quelques centaines, deux approches sont possibles. La première consiste à s’atteler manuellement à la tâche en allant rechercher une à une les données non qualitatives. Certes chronophage et quelque peu artisanale, cette méthode est néanmoins la plus efficace lorsqu’elle est effectuée à intervalles réguliers.

A défaut, et en particulier si le nombre de vos prospects est très élevé, il existe heureusement des solutions technologiques permettant de s’exonérer de ce travail fastidieux. Le nettoyage des données est une étape indispensable pour s’assurer de la qualité des informations.

 

Découvrez l’extrait du livre blanc “Comment le Big Data fait évoluer les pratiques commerciales”