www.wikidata.de-de.nina.az
Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen beispielsweise Einzelnachweisen ausgestattet Angaben ohne ausreichenden Beleg konnten demnachst entfernt werden Bitte hilf Wikipedia indem du die Angaben recherchierst und gute Belege einfugst Eine Dublette ist ein Datensatz in einer Datenbank der redundant d h mehrfach vorhanden ist dessen Redundanz aber aufgrund abweichender Schreibung nicht durch Prufung auf gleiche Inhalte erkannt werden kann Bei einer Dublette handelt es sich nicht um Redundanz im Sinne der Informationstechnologie also nicht um Redundanz die aufgrund der Architektur des Systems absichtlich verursacht wird Dubletten entstehen insbesondere in Adressdatenbanken und zwar dann wenn dieselbe Person oder Gesellschaft mehrfach auf Basis unterschiedlicher Eingangsinformationen erfasst wird mehrere Adressdatenbestande vereinigt werden oder die erfassten Personen oder Unternehmen ihren Namen wechseln Da Dubletten insbesondere beim Massenversand unnotige Kosten verursachen und negative Folgen fur das Image haben konnen wird mit entsprechender Software versucht die Dubletten zu identifizieren und automatisch oder halbautomatisch zu bereinigen Deduplikation Hierbei kommen mehr oder weniger scharfe phonetische musterbezogene oder assoziative Algorithmen zur Anwendung Auch in Material und Produktdaten konnen Dubletten auftreten Nach der Fusion zweier Unternehmen sind meist viele Bauteile in beiden Unternehmen vorhanden jedoch in unterschiedlicher Schreibweise verzeichnet Abgerufen von https de wikipedia org w index php title Dublette Datenbank amp oldid 232293986