www.wikidata.de-de.nina.az
Tokenisierung bezeichnet in der Computerlinguistik die Segmentierung eines Textes in Einheiten der Wortebene manchmal auch Satze Absatze o A Die Tokenisierung des Textes ist Voraussetzung fur dessen Weiterverarbeitung beispielsweise zur syntaktischen Analyse durch Parser im Textmining oder Information Retrieval In der Informatik bezeichnet der Begriff analog die Zerlegung eines in einer Programmiersprache verfassten Computerprogrammes in kleinste Einheiten siehe Token Ubersetzerbau und Tokenbasierte Kompression Ausserdem wird mit Tokenisierung im Finanzwesen auch der Trend zur Abschaffung des Tragermediums Papier Urkunde durch digitale Daten bezeichnet Inhaltsverzeichnis 1 Probleme der Tokenisierung 2 Finanzwesen 3 Literatur 4 EinzelnachweiseProbleme der Tokenisierung BearbeitenUblicherweise wird ein Text bei der Tokenisierung in seine Worter zerlegt Die White Space Tokenisierung ist die einfachste Form einer solchen Zerlegung Der Text wird bei diesem Verfahren an den Leer und Interpunktionszeichen aufgetrennt Bei nicht segmentisierenden Schriften wie der chinesischen oder japanischen kann es nicht angewandt werden da in diesen keine Leerzeichen vorhanden sind Bei einem alternativen Tokenisierungsverfahren bilden Folgen von Buchstaben einen Token ebenso alle Folgen von Ziffern Alle anderen Zeichen bilden fur sich genommen einen Token Beide Verfahren sind jedoch problematisch im Fall von Mehrwortlexemen speziell Eigennamen Wahrungsangaben usw Fur den Satz Klaus Rudiger kauft in New York fur 2 50 Fish n Chips ware aus linguistischer Sicht eine Segmentierung in folgende Tokenfolge adaquater Klaus Rudiger kauft in New York fur 2 50 Fish n ChipsFinanzwesen BearbeitenTokenisierung ist im Finanzwesen und im Wertpapierrecht der Trend Finanzprodukte als Kryptowerte zu digitalisieren und auf einer Blockchain als dezentral gespeicherte Vermogenswerte abzubilden 1 Der Trend fuhrt weg von der klassischen Papierform eines Tragermediums hin zu digitalen Daten Beispiele sind die Verwendung von Buchgeld anstatt Bargeld die Einfuhrung von Kryptowahrungen oder die Einfuhrung von elektronischen Wertpapieren anstelle von Wertpapierurkunden Bei allen wird die Papierform als Tragermedium fur Finanzinstrumente abgelost tokenisiert durch digitale Formen 2 Das Gesetz uber elektronische Wertpapiere eWpG vom Juni 2021 ermoglicht den Wertpapierhandel mit vollig urkundenlosen Finanzinstrumenten indem es deren Ubergabe durch Eintragung im Wertpapierregister nach 4 Abs 4 eWpG ersetzt 3 Literatur BearbeitenKai Uwe Carstensen Christian Ebert Cornelia Ebert Susanne Jekat Ralf Klabunde Hagen Langer Computerlinguistik und Sprachtechnologie Eine Einfuhrung 3 Auflage Spektrum Akademischer Verlag Heidelberg 2010 ISBN 9783827420237 S 264 271Einzelnachweise Bearbeiten BaFin vom 16 August 2019 Zweites Hinweisschreiben zu Prospekt und Erlaubnispflichten im Zusammenhang mit der Ausgabe sogenannter Krypto Token Az GZ WA 51 Wp 7100 2019 0011 und IF 1 AZB 1505 2019 0003 S 1 Adam Reining Lexikon der Aussenwirtschaft 2003 S 99 BT Drs 19 26925 vom 24 Februar 2021 Entwurf eines Gesetzes zur Einfuhrung von elektronischen Wertpapieren S 39Bitte den Hinweis zu Rechtsthemen beachten Abgerufen von https de wikipedia org w index php title Tokenisierung amp oldid 234981613