Les procédures de déduplication mises en oeuvre font appel à différentes applications informatiques qui permettent entre autre :
- d'épurer chacun des champs d'un enregistrement.
(ex : suppression des caractères non valides ou non significatifs)
- de normaliser* les différentes abréviations des champs adresses.
(ex : remplacer les BLD par BOULEVARD ou BD en fonction du nombre de caractères de ce champs)
- de restructurer* les différents champs de votre base de données.
(ex : remettre dan l'ordre les champs 'société' et 'nom')
|
- de découper* un champ contenant deux informations.
(ex : séparer 'l'adresse' et le 'complément d'adresse' qui ont été saisi dans le même champ)
- de définir, selon vos critères, une déduplication qui prend en compte une sélection de champs ou la totalite de l'enregistrement.
- de préciser le taux de rapprochement que vous accorder à deux fiches.
(ex : il peut y avoir Mr Paul Martin et Mr Paul Martine à la même adresse.
|