www.wikidata.de-de.nina.az
Ein Tomita Parser nach Masaru Tomita ist ein Parsverfahren fur kontextfreie Grammatiken das eine Verallgemeinerung des LR k Verfahrens ist Das Verfahren wird deshalb auch GLR k Verfahren fur Generalized LR k genannt Ausgangspunkt des Tomita Parsers ist der Tabellenerstellungsvorgang des LR k Verfahrens Bei Grammatiken die nicht die LR k Eigenschaft haben u a aber nicht nur ambige Grammatiken fuhrt dieser Vorgang zu Mehrfacheintragen sog Konflikten Shift Reduce Konflikt es besteht die Moglichkeit das nachste Eingabesymbol auf den Stapel des Parsers zu legen oder eine erkannte rechte Seite einer Produktionsregel durch die linke Regelseite zu ersetzen Reduce Reduce Konflikt es gibt mindestens zwei Produktionsregeln mit deren Hilfe eine Reduktion erfolgen kann Der Algorithmus des Tomita Parsers verfolgt diese Konflikte pseudo parallel weiter Als Datenstruktur wird ein sog Graphstapel graph structured stack ein gerichteter azyklischer Graph verwendet der alle bereits vollzogenen Parsoperationen reprasentiert Inhaltsverzeichnis 1 Graphstapel 2 Parsalgorithmus 3 Beziehung zu anderen Parsverfahren 4 LiteraturGraphstapel BearbeitenDie verwendete Reprasentation der Parsergebnisse geschieht ahnlich wie beim Chart Parser mittels eines gerichteten azyklischen Graphen nbsp Abb 1 Graphstack fur den Satz sie beobachtet den Einbrecher mit dem FernglasAbb 1 zeigt einen solchen Graphen nach Beendigung des Parsvorgangs fur den Beispielsatz sie beobachtet den Einbrecher mit dem Fernglas Die dabei verwendete ambige Grammatik ist S DP VP VP Vbar VP VP PP Vbar Vtrans DP DP Det NP DP Pron NP Nbar Nbar N Nbar Nbar PP PP P DPFur den Beispielsatz erlaubt sie zwei verschiedene syntaktische Analysen Aufgrund dieser Ambiguitat hat sie nicht die LR k Eigenschaft fuhrt also zu Mehrfacheintragen in der Parstabelle Jeder Graphknoten hat einen eindeutigen Knotennamen dieser beginnt mit n Die roten Knoten enthalten Elemente aus dem Vokabular der Grammatik also einerseits Nichtterminalsymbole und andererseits Worter Terminalsymbole Die blauen Knoten dagegen enthalten Zustandsnummern der LR Parstabelle Man kann schon sehen wie im Knoten n21 zwei bis dahin verschiedene Analysen bei der Integration der Praposition mit wieder zusammenlaufen Die nachfolgende Prapositionalphrase mit dem Fernglas wird also nur einmal analysiert Parsalgorithmus BearbeitenWie beim LR k Verfahren besteht der Parsprozess aus eine Reihe von tabellengesteuerten Shift bzw Reduktionsschritten Beim Shift Schritt wird ein Wort aus der Eingabe entfernt und auf den Stapel gelegt Bei einem Reduktionsschritt wird die rechte Seite g einer Produktionsregel A g die in umgekehrter Reihenfolge auf dem Stapel liegt durch die linke Regelseite A ersetzt Im Unterschied zum LR k Verfahren wird der reduzierte Teil jedoch nicht aus dem Stapel geloscht sondern bleibt erhalten Dies bedeutet dass der Stapel monoton wachst Der Vorgang wird durch die GLR k Tabelle gesteuert Zu jedem Zeitpunkt befindet sich der Parser in einem definierten Zustand vgl Kellerautomat Mit diesem Zustand und dem den nachsten Symbol en der Eingabe wird die GLR k Tabelle konsultiert und die nachsten Operationen shift reduce accept error und der Folgezustand bestimmt Im Fall von Mehrfacheintragen Konflikten werden diese quasi parallel verfolgt Nachfolgende Shift Operationen konnen diese parallelen Verarbeitungsstrange jedoch wieder synchronisieren dies ist wichtig fur die Zeitkomplexitat des Verfahrens Beziehung zu anderen Parsverfahren BearbeitenDer Tomita Parser ist ein vorkompilierter Chart Parser Literatur BearbeitenDick Grune Jacobs Ceriel J H Parsing Techniques Springer Science Business Media 2008 ISBN 978 0 387 20248 8 Masaru Tomita LR parsers for natural languages In Coling 1984 10th International Conference on Computational Linguistics 1984 S 354 357 Masaru Tomita An efficient context free parsing algorithm for natural languages In International Joint Conference on Artificial Intelligence 1985 S 756 764 Abgerufen von https de wikipedia org w index php title Tomita Parser amp oldid 198897923