www.wikidata.de-de.nina.az
Successor Variety ist eine Methode aus der Linguistik bei der es darum geht die Morpheme eines Wortes zu ermitteln Dies geschieht dadurch dass die Morphemgrenzen bestimmt werden Das Verfahren geht auf Zellig S Harris zuruck Hagen Langer hat das Verfahren modifiziert und kam bei einem Test auf nur 7 24 falsche Segmentierungen 1 Unter anderem wird Successor Variety im Information Retrieval benutzt um bei einer Vorverarbeitung von Dokumenten eine Stammwortreduktion durchzufuhren Inhaltsverzeichnis 1 Verfahren 2 Beispiel 3 Siehe auch 4 Literatur 5 EinzelnachweiseVerfahren BearbeitenUm die Morphemgrenzen uber die Nachfolgevielfalt zu bestimmen benotigt man eine Gruppe von Wortern aus der man das zu bestimmende Wort wahlt Nun geht man dieses Wort Buchstabe fur Buchstabe durch und zahlt die Anzahl der Buchstaben die folgen konnten um aus diesem Teilwort ein gultiges Wort aus der Wortmenge zu bilden Die Anzahl der moglichen Buchstaben wird dabei immer weiter abnehmen bis man auf die Morphemgrenze stosst wo sie dann sprunghaft ansteigt Beispiel BearbeitenIn der Praxis muss die Wortmenge bedeutend grosser sein Sei die Wortmenge holen gehen haben hassen Haustier Hausaufgabe Hilfe heiter Haushalt Das zu bearbeitende Wort sei HausaufgabeH Buchstaben o a i e Anzahl 4Ha Buchstaben b s u Anzahl 3Hau Buchstaben s Anzahl 1Haus Buchstaben t a h Anzahl 3Hausa Buchstaben u Anzahl 1Hausau Buchstaben f Anzahl 1Hausauf Buchstaben g Anzahl 1Hausaufg Buchstaben a Anzahl 1Hausaufga Buchstaben b Anzahl 1Hausaufgab Buchstaben e Anzahl 1Hausaufgabe Buchstaben Anzahl 0Die Morphemgrenze liegt hier bei Haus da dort die Buchstabenanzahl von 1 auf 3 ansteigen Siehe auch BearbeitenSegmentierung Linguistik Literatur BearbeitenZellig S Harris From phoneme to morpheme In Language 31 1955 190 222 Auch in Derselbe Papers in Structural and Transormational Linguistics Reidel Dordrecht 1970 Seite 32 67 Zellig S Harris Morpheme Boundaries within Words Report on a Computer Test In Transformations and Discourse Analysis Papers 73 Dordrecht 1967 Auch in Derselbe Papers in Structural and Transormational Linguistics Reidel Dordrecht 1970 Seite 68 77 Ursula Klenk Hagen Langer Morphological Segmentation Without a Lexicon In Literary and Linguistic Computing Volume 4 Number 4 1989 Seite 247 253 Hagen Langer Ein automatisches Morphsegmentierungsverfahren fur deutsche Wortformen Diss phil Gottingen 1991 Einzelnachweise Bearbeiten Langer 1991 Seite 81 Abgerufen von https de wikipedia org w index php title Successor Variety amp oldid 196367979