www.wikidata.de-de.nina.az
Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen beispielsweise Einzelnachweisen ausgestattet Angaben ohne ausreichenden Beleg konnten demnachst entfernt werden Bitte hilf Wikipedia indem du die Angaben recherchierst und gute Belege einfugst Der Jaccard Koeffizient oder Jaccard Index auch Intersection over Union nach dem Schweizer Botaniker Paul Jaccard 1868 1944 ist eine Kennzahl fur die Ahnlichkeit von Mengen Oft wird er auch nach seiner Definition als IoU Intersection over Union bezeichnet Schnittmenge oben und Vereinigungsmenge unten von zwei Mengen A und B Inhaltsverzeichnis 1 Geschichte 2 Definition 3 Beispiel 4 Jaccard Metrik 5 Anwendungen 6 EinzelnachweiseGeschichte BearbeitenJaccard entwickelte den Jaccard Koeffizienten in seiner 1902 erschienenen Schrift Lois de distribution florale dans la zone alpine auf Seite 72 Er nannte ihn coefficient de communaute florale 1 2 Der Jaccard Koeffizient konnte sich in der Mathematik etablieren und wird als Ahnlichkeitsmass fur Mengen Vektoren und ganz allgemein fur Objekte genutzt 3 4 Speziell wird der Jaccard Koeffizient fur automatische Texterkennung und Interpretation eingesetzt 5 Definition BearbeitenUm den Jaccard Koeffizient zweier Mengen zu berechnen teilt man die Anzahl der gemeinsamen Elemente Schnittmenge durch die Grosse der Vereinigungsmenge J A B A B A B displaystyle J A B frac A cap B A cup B nbsp Fur n displaystyle n nbsp Mengen gilt J S 1 S 2 S n S 1 S 2 S n S 1 S 2 S n displaystyle J S 1 S 2 dotsc S n frac S 1 cap S 2 cap dotsb cap S n S 1 cup S 2 cup dotsb cup S n nbsp Je naher der Jaccard Koeffizient an 1 liegt desto grosser ist die Ahnlichkeit der Mengen Der minimale Wert des Jaccard Koeffizienten ist 0 Beispiel BearbeitenDie beiden Mengen A 1 2 3 4 7 displaystyle A 1 2 3 4 7 nbsp und B 1 4 5 7 9 displaystyle B 1 4 5 7 9 nbsp haben den Jaccard Koeffizienten A B A B 1 4 7 1 2 3 4 5 7 9 3 7 0 429 displaystyle frac A cap B A cup B frac 1 4 7 1 2 3 4 5 7 9 frac 3 7 0 429 dotso nbsp Jaccard Metrik BearbeitenAus dem Jaccard Koeffizienten lasst sich die Jaccard Metrik auch Jaccard Distanz genannt ableiten Diese ist ein Mass fur die Unahnlichkeit Diese Metrik berechnet sich nach der Formel J d A B d J A B 1 J A B A B A B A B displaystyle J delta A B d J A B 1 J A B frac A cup B A cap B A cup B nbsp Allgemein J d S 1 S 2 S n d J S 1 S 2 S n 1 J S 1 S 2 S n S 1 S 2 S n S 1 S 2 S n S 1 S 2 S n displaystyle J delta S 1 S 2 dotsc S n d J S 1 S 2 dotsc S n 1 J S 1 S 2 dotsc S n frac S 1 cup S 2 cup dotsb cup S n S 1 cap S 2 cap dotsb cap S n S 1 cup S 2 cup dotsb cup S n nbsp Je naher die Jaccard Metrik an 0 liegt desto naher liegen die Mengen A und B beieinander weil sie sich sehr ahnlich sind Der maximale Wert der Jaccard Metrik ist 1 Dann sind die Mengen uberschneidungsfrei Anwendungen BearbeitenIm Bereich Textmining und hier insbesondere der Duplikaterkennung ist die Jaccard Ahnlichkeit ein bekanntes Mass fur die Ahnlichkeit zweier Elemente Dabei werden zwei Strings in Token zerlegt z B geteilt an den Leerzeichen oder unter Verwendung von N Grammen mit N gt 1 displaystyle N gt 1 nbsp Die daraus entstehenden Mengen an Stringabschnitten werden wie oben beschrieben zur Berechnung der Ahnlichkeit der beiden Mengen verwendet 6 Einzelnachweise Bearbeiten Paul Jaccard Lois de distribution florale dans la zone alpine Bulletin de la Societe Vaudoise des Sciences Naturelles Band 38 1902 S 72 doi 10 5169 seals 266762 110 Abgerufen am 23 November 2018 Huihuan Qian Intelligent surveillance systems Springer Dordrecht 2011 ISBN 978 94 007 1137 2 Ahnlichkeitsmasse fur Vektoren bei Fraunhofer Abgerufen am 23 November 2018 Jaccard Koeffizient in Hans Friedrich Eckey Reinhold Kosfeld Martina Rengers Multivariate Statistik Betriebswirtschaftlicher Verlag Dr Th Gabler GmbH Wiesbaden 2002 ISBN 3 409 11969 8 S 219 Abgerufen am 23 November 2018 Jaccard Koeffizient bei seo suedwes Abgerufen am 23 November 2018 Bing Liu Web Data Mining Exploring Hyperlinks Contents and Usage Data 2 Auflage Springer Verlag Berlin Heidelberg 2011 ISBN 978 3 642 19459 7 S 231 f Abgerufen von https de wikipedia org w index php title Jaccard Koeffizient amp oldid 237730426