www.wikidata.de-de.nina.az
Dieser Artikel behandelt Stoppworter im Bereich der Suchmaschinen zu Stoppwortern in der Sexualitat siehe Safeword Stoppworter nennt man in der Informationsruckgewinnung bzw im Information Retrieval Worter die bei einer Volltextindexierung nicht beachtet werden da sie sehr haufig auftreten und gewohnlich keine Relevanz fur die Erfassung des Dokumentinhalts besitzen Die Stoppworter befanden sich bei alteren Suchmaschinen gewohnlich auf einer Liste und wurden aus dem Text entfernt und nicht indexiert Heute basieren die meisten Internet Suchmaschinen auf Vollindexierung dabei werden die Stoppworter angezeigt tragen aber nichts zur Suche bei 1 Es handelt sich ublicherweise bei den Stoppwortern um die am haufigsten vorkommenden Worter einer Sprache Man spricht dann auch von einer festen Stoppwortliste Allen Stoppwortern ist gemeinsam dass sie vor allem grammatikalische syntaktische Funktionen ubernehmen und daher keine Ruckschlusse auf den Inhalt des Dokumentes zulassen 2 Eine weitere Gemeinsamkeit ist ihre grosse Zahl Sie treten in jedem Dokument sehr oft auf und kommen in sehr vielen Dokumenten vor wodurch sie bei der Erschliessung der Dokumente einen hohen Aufwand verursachen wurden Handelt es sich um die am haufigsten vorkommenden Worter einer Menge von Dokumenten beispielsweise Akten und Berichte spricht man von einer berechneten Stoppwortliste Das Erkennen von Stoppwortern macht Suchmaschinen effizienter Wurde man Stoppworter bei einem Suchauftrag beachten ware nahezu jedes Dokument ein Treffer Ein solches Suchergebnis ware fur den Anwender nutzlos 3 Allerdings ist es nicht immer sinnvoll Stoppworter komplett auszublenden Beispiele hierfur sind im Englischen die Rockgruppe The Who oder im Deutschen Die Arzte und Personen mit dem Nachnamen Weil 4 Daher ist es heute bei Vollindizierung moglich auch nach diesen Kombinationen suchen zu lassen 5 Fruher war dazu bei den meisten Suchmaschinen ein Operator notwendig zum Beispiel oder die Phrasensuche 6 Allgemein ubliche Stoppworter in deutschsprachigen Dokumenten sind bestimmte Artikel der die das unbestimmte Artikel einer eine ein Konjunktionen z B und oder doch weil und haufig gebrauchte Prapositionen z B an in von sowie die Negation nicht 1 Im Englischen sind unter anderem a of the I it you und and Stoppworter Abhangig von den zu erschliessenden Dokumenten konnen Stoppworter auch mehrsprachig vorliegen Obwohl eher als Stoppzeichen zu benennen werden haufig auch der Punkt das Komma und der Strichpunkt als Stoppworter bezeichnet In der freien Software Bibliothek NLTK sind Listen von Stoppwortern fur 21 Sprachen sowie fertige Methoden zu deren Benutzung enthalten 7 8 Hans Peter Luhn einer der Pioniere des Information Retrieval pragte den Begriff der Stoppworter und benutzte dieses Konzept im Design und in der Implementation des Indexers KWIC 5 Abzugrenzen ist das Stoppwort von den sogenannten Black Lists dabei handelt es sich um eine Liste von unzulassigen Wortern Das Vorkommen eines solchen fuhrt nicht zum Ausschluss des Wortes aus der Indizierung sondern zur Elimination des gesamten Dokuments 9 Weblinks BearbeitenListe englischer Stoppworter Liste deutscher StoppworterEinzelnachweise Bearbeiten a b Daniel Koch Suchmaschinen Optimierung Website Marketing fur Entwickler Pearson Deutschland 2007 ISBN 978 3 8273 2469 6 S 35 Mario Fischer Website Boosting 2 0 Suchmaschinen Optimierung Usability Online Marketing mitp Verlag 2009 ISBN 978 3 8266 1703 4 S 203 Andre Klahold Empfehlungssysteme Recommender Systems Grundlagen Konzepte und Losungen Springer Verlag 2009 ISBN 978 3 8348 0568 3 S 25 Der unsichtbare Ministerprasident Stoppwort November 2017 abgerufen am 2 November 2017 a b Tom Slevin Stop Words Kids Code and Computer Science November 2013 abgerufen am 11 Mai 2016 Philipp Wiedmaier Suchmaschinenoptimierung am Beispiel von Google Diplom de 2006 ISBN 978 3 8324 9838 2 S 55 2 Accessing Text Corpora and Lexical Resources NLTK org abgerufen am 10 April 2019 englisch python Stopword removal with NLTK stackoverflow com abgerufen am 10 April 2019 englisch Michael Gloggler Suchmaschinen im Internet Funktionsweisen Ranking Methoden Top Positionen Springer Verlag 2013 ISBN 978 3 642 59321 5 S 56 Abgerufen von https de wikipedia org w index php title Stoppwort amp oldid 238634881