Keywords: Adressqualität, Datenqualität, Data Quality, Adressen, Adressdatenbank, CRM, Dubletten, Dublettenprüfung, Dublettenbereinigung, Verschmelzung, Software.

Verschmelzung

Es wird leicht übersehen, dass es nicht reicht, Dubletten zu finden. Die Dublettenadressen müssen auch bereinigt werden.

Beispiel:

Nr
Titel
Vorname
Name
Telefon
1
Hans
Maier
+49 89 811 331
2
Dr.
Maier
+49 89 811 442
Ergebnis bei Selektion von Satz 1:
Hans
Maier
+49 89 811 331
Ergebnis bei Selektion von Satz 2:
Dr.
Maier
+49 89 811 442
Ergebnis bei Verschmelzung von Satz 1 und 2:
Dr.
Maier
+49 89 811 331, +49 89 811 442

Das klassische Verfahren ist die Selektion: Es wird eine Adresse ausgewählt, die überlebt, und die übrigen Adressen werden eliminiert. Bei der Auswahl kann man zwar gewisse Prioritäten festlegen, also etwa die Adressen aus einer bestimmten Datei oder die Adresse mit dem jüngsten Änderungsdatum bevorzugen. Auf jeden Fall gehen aber die Informationen aus den eliminierten Adressen unter.

Selbst bei einfachen Anwendungen wie der Vorbereitung eines Mailings führt die Selektion zu unbefriedigenden Ergebnissen. Hat man etwa zwei Dubletten, eine mit dem Titel und die anderen mit dem Vornamen (also zum Beispiel „Dr. Maier“ und „Hans Maier“), dann überlebt bei der Selektion entweder der „Dr. Maier“ oder der „Hans Maier“. Die erwünschte Vervollständigung zu „Dr. Hans Maier“ kann nur die Verschmelzung leisten. Deswegen empfiehlt sich, die Verschmelzung auch bei so einfachen Aufgabenstellungen wie der Dublettenbereinigung für ein Mailing einzusetzen.

q.address lässt komplexe Verschmelzungsregeln zu: zum Beispiel die Auswahl eines Vornamens aus einer bevorzugten Datei (wenn mehrere Dateien unterschiedliche Prioritäten haben) und innerhalb derselben Datei der Vorname aus der Adresse mit dem jüngsten Änderungsdatum. (Siehe Abbildung 1)

Wichtig ist auch die Möglichkeit der Konkatenierung. Enthalten verschiedene Dublettenadressen verschiedene Telefonnummern, möchte man gerne alle Telefonnummern erhalten. Mit Hilfe der Konkatenierung werden alle Telefonnummern in den Ergebnissatz übernommen. Die gefundenen Dubletten werden ohne Datenverlust „verschmolzen“. (Siehe Abbildung 2)

qaddress-Verschmelzung
Abbildung 1 – Verschmelzungsregel für der Vornamen: Die Anweisung ist von rechts nach links zu lesen. Zunächst werden alle vorhandenen Vornamen ausgewählt (nonempty). Aus diesen werden jene ausgewählt, die zu der Datei mit der höchsten Dateipriorität gehören (maxfileprio). Unter den verbleibenden Vornamen wird nun der Vorname zum jüngsten Änderungsdatum ausgewählt (maxaddressprio).
qaddress-Verschmelzung
Abbildung 2 – Verschmelzungsregel für die Telefonnummer: Es werden alle vorhandenen, eindeutigen Telefonnummern ausgewählt (nonempty) und aneinandergehängt. Die Nummern werden dabei jeweils durch ein Semikolon getrennt (concatunique).

Beachten Sie in Abbildung 1 und 2 die zahlreichen weiteren möglichen Verschmelzungsfunktionen!

Produkte

Die Verschmelzung (bei der Bereinigung von Adressdateien) ist verfügbar in:

QADDRESS-LOGO-blue