www.wikidata.de-de.nina.az
Chomsky Hierarchie gelegentlich Chomsky Schutzenberger Hierarchie benannt nach dem Linguisten Noam Chomsky und dem Mathematiker Marcel Schutzenberger ist ein Begriff aus der theoretischen Informatik Sie ist eine Hierarchie von Klassen formaler Grammatiken die formale Sprachen erzeugen und wurde 1956 erstmals von Noam Chomsky beschrieben Die Hierarchiestufen unterscheiden sich darin wie rigide die Einschrankungen fur die Form zulassiger Produktionsregeln auf der jeweiligen Stufe sind bei Typ 0 Grammatiken sind sie uneingeschrankt bei hoheren Stufen fortschreitend starker beschrankt Grammatiken niedrigeren Typs sind erzeugungsmachtiger als die hoherer Typen Eine Sprache die von einer Grammatik des Typs k erzeugt wird heisst eine Sprache des Typs k Neben die Chomsky Hierarchie der Grammatiken tritt in diesem Sinne eine Chomsky Hierarchie der Sprachen Inhaltsverzeichnis 1 Hintergrunde 2 Die Hierarchie 2 1 Typ 0 Grammatik allgemeine Chomsky Grammatik oder Phrasenstrukturgrammatik 2 1 1 Definition 2 1 2 Von Typ 0 Grammatiken erzeugte Sprachen 2 2 Typ 1 Grammatik kontextsensitive Grammatik 2 2 1 Definition 2 2 2 Von Typ 1 Grammatiken erzeugte Sprachen 2 2 3 Monotone Grammatiken 2 3 Typ 2 Grammatik kontextfreie Grammatik 2 3 1 Definition 2 3 2 Von Typ 2 Grammatiken erzeugte Sprachen 2 4 Typ 3 Grammatik regulare Grammatik 2 4 1 Definition 2 4 2 Von Typ 3 Grammatiken erzeugte Sprachen 2 5 Ubersicht 3 Chomsky Hierarchie fur formale Sprachen 4 Naturliche Sprachen 5 Literatur 6 EinzelnachweiseHintergrunde BearbeitenFormale Sprachen haben den Vorzug mathematisch exakt analysiert werden zu konnen Formalen Sprachen liegt ein vorgegebenes Alphabet ein Zeichenvorrat zugrunde das haufig mit S displaystyle Sigma nbsp bezeichnet wird Beliebig lange endliche Folgen von Elementen des Alphabets werden als Worter uber dem Alphabet bezeichnet Mengen solcher Worter sind schliesslich formale Sprachen Die umfassendste formale Sprache uber einem vorgegebenen Alphabet S displaystyle Sigma nbsp ist unendlich gross sie enthalt samtliche Worter die durch beliebiges Zusammenfugen von Zeichen des Alphabets gebildet werden konnen Sie lasst sich durch die Kleenesche Hulle des Alphabets beschreiben also S displaystyle Sigma nbsp Die kleinste formale Sprache enthalt gar keine Worter Andere formale Sprachen bestehen nur aus wenigen Wortern und lassen sich somit als endliche Menge notieren beispielsweise fur das Alphabet S a b displaystyle textstyle Sigma a b nbsp die Sprache aller Worter der Lange zwei L a a a b b a b b displaystyle textstyle L aa ab ba bb nbsp Unendliche Sprachen lassen sich begreiflicherweise nicht durch Aufzahlen notieren Um sie exakt zu beschreiben ist ein Konzept notig das auch unendliche Mengen definieren kann Hierzu werden im Rahmen der formalen Sprachen vor allem Erzeugungsverfahren benutzt Geht man von einem vorhandenen Wort uber einem Alphabet aus lassen sich durch Semi Thue Systeme Wortmengen spezifizieren die sich durch beliebig wiederholtes Anwenden von Ersetzungsregeln ergeben Ersetzungsregeln der Form a b displaystyle alpha rightarrow beta nbsp erlauben dass in einem Wort das ein Segment a displaystyle alpha nbsp enthalt dieses Segment durch b displaystyle beta nbsp ersetzt wird Semi Thue Systeme geben daher eine Ableitungsrelation zwischen Wortern formaler Sprachen an Zwei Worter stehen in Relation wenn das eine Wort durch eine Ersetzungsregel vom anderen Wort abgeleitet werden kann Zur Beschreibung von formalen Sprachen eignen sich formale Grammatiken ein gegenuber Semi Thue Systemen erweitertes und machtigeres Konzept Sie unterscheiden sich von Semi Thue Systemen darin dass sie sogenannte Terminalsymbole und Nichtterminalsymbole kennen Terminalsymbole einer Grammatik sind gerade alle Zeichen ihres Zeichensatzes S displaystyle Sigma nbsp Die erste anwendbare Regel geht immer von einem nichtterminalen Startsymbol aus und das Ergebnis eines Ersetzungsvorgangs gilt nur dann als Wort ihrer formalen Sprache wenn es keine Nichtterminalsymbole enthalt Das folgende Beispiel beschreibt eine Sprache mit der sich beliebig lange Summen der Ziffern 1 2 und 3 ausdrucken lassen Das dafur angemessene Alphabet ist S 1 2 3 displaystyle Sigma 1 2 3 nbsp Die entsprechenden Terminalsymbole sind unterstrichen dargestellt Nicht Terminale kursiv Die folgenden Zeilen stellen die Regeln dar S u m m e Z i f f e r S u m m e S u m m e Z i f f e r Z i f f e r 1 Z i f f e r 2 Z i f f e r 3 displaystyle begin aligned mathit Summe amp rightarrow mathit Ziffer mathit Summe amp rightarrow mathit Summe underline mathit Ziffer mathit Ziffer amp rightarrow underline 1 mathit Ziffer amp rightarrow underline 2 mathit Ziffer amp rightarrow underline 3 end aligned nbsp Das Startsymbol dieser Sprache ist Summe Davon ausgehend kann man nun beliebige Regeln nacheinander anwenden um einen gultigen Ausdruck zu erzeugen S u m m e Startsymbol S u m m e Z i f f e r mit zweiter Regel Z i f f e r Z i f f e r mit erster Regel 1 Z i f f e r mit 1 Ziffern Regel 1 2 mit 2 Ziffern Regel displaystyle begin aligned amp mathit Summe amp quad amp text Startsymbol amp mathit Summe underline mathit Ziffer amp amp text mit zweiter Regel amp mathit Ziffer underline mathit Ziffer amp amp text mit erster Regel amp underline 1 mathit Ziffer amp amp text mit 1 Ziffern Regel amp underline 1 2 amp amp text mit 2 Ziffern Regel end aligned nbsp Nicht alle unendlichen Sprachen lassen sich als formale Sprachen mit diesem Erzeugungsprinzip beschreiben es ist aber kein tauglicheres Konzept bekannt Ein anderer gangiger Formalismus zur Beschreibung von Sprachen sind Automatenmodelle vor allem Turingmaschinen Uneingeschrankte formale Grammatiken und Turingmaschinen sind bei der Beschreibung von formalen Sprachen gleichmachtig d h zu jeder von einer formalen Grammatik erzeugten Sprache gibt es eine Turingmaschine die genau diese akzeptiert und umgekehrt Ebenso wie verschiedene Automatenmodelle definiert wurden definierte Chomsky in seiner Arbeit verschiedene Grammatiktypen Durch drei fortlaufend scharfere Einschrankungen an die jeweils darin zulassigen Ersetzungsregeln stellte er eine Hierarchie aus vier Klassen von formalen Grammatiken auf wodurch die weniger eingeschrankten Klassen die starker regulierten Klassen jeweils echt umfassen Das Gleiche gilt fur die von den jeweiligen Grammatikklassen beschriebenen Sprachklassen auch sie bilden eine Hierarchie Sprachen eingeschrankteren Grammatiktyps sind ublicherweise einfacher algorithmisch zu verarbeiten um den Preis weniger ausdrucksmachtig zu sein Regulare Ausdrucke mit denen man etwa Muster fur die Suche in Texten definiert entsprechen zum Beispiel den sehr eingeschrankten Chomsky Grammatiken des Typs 3 regulare Grammatiken und solche Textsuchen sind effektiv und schnell Dagegen taugen Grammatiken des Typs 3 wegen ihrer Einfachheit nicht zur Beschreibung von Programmiersprachen fur die man meist weniger eingeschrankte Typ 2 Grammatiken benutzt Die Hierarchie BearbeitenDie Chomsky Hierarchie umfasst vier Typen formaler Grammatiken gezahlt von 0 bis 3 Typ 0 umfasst alle formalen Grammatiken uberhaupt also ohne Einschrankung an die Gestalt zulassiger Erzeugungsregeln Grammatiken des Typs 1 bis Typ 3 sind dann zunehmend starker eingeschrankt Allein nach Definition ist eine Grammatik vom Typ 1 auch vom Typ 0 eine Grammatik vom Typ 2 auch vom Typ 1 eine Grammatik vom Typ 3 auch vom Typ 2 die Umkehrungen gelten nicht Deshalb bilden diese Klassen eine echte Hierarchie Bei den entsprechenden Sprachklassen zeigen Gegenbeispiele dass ebenfalls die Umkehrungen nicht gelten weshalb auch sie eine echte Hierarchie bilden Chomsky forderte fur Typ 1 Typ 2 und Typ 3 Grammatiken dass die rechte Seite von Produktionsregeln nicht kurzer als die linke Seite sein darf was auch das leere Wort auf jeder rechten Seite einer Produktionsregel ausschliesst Heute ist man oft weniger restriktiv die Definitionen sind oft so gefasst dass die Hierarchie der Sprachen nicht gestort wird sie es aber auch Grammatiken des Typs 1 kontextsensitive Grammatiken durch eine Ausnahmeregel erlauben das leere Wort zu erzeugen und den Typen 2 kontextfreien Grammatiken und 3 regularen Grammatiken sogar ohne Einschrankung das leere Wort als rechte Seite von Ersetzungsregeln gestatten Typ 0 Grammatik allgemeine Chomsky Grammatik oder Phrasenstrukturgrammatik Bearbeiten Hauptartikel Formale Grammatik Definition Bearbeiten Typ 0 Grammatiken werden auch unbeschrankte Grammatiken genannt Es handelt sich dabei um die Klasse aller formalen Grammatiken der Form G displaystyle G nbsp V T P S displaystyle V T P S nbsp wobei V T N displaystyle V T cup N nbsp ein Vokabular ist bestehend aus der disjunkten Vereinigung eines endlichen Alphabets T displaystyle T nbsp Terminalsymbole und einer Menge von Nichtterminalen Variablen N displaystyle N nbsp 1 Das ausgezeichnete Symbol S N displaystyle S in N nbsp wird als Startsymbol bezeichnet und P displaystyle P nbsp ist eine Menge von Produktionsregeln P displaystyle P subset nbsp V T displaystyle V setminus T nbsp displaystyle times nbsp V displaystyle V nbsp displaystyle nbsp V N V displaystyle V NV nbsp displaystyle times nbsp V displaystyle V nbsp d h auf der linken Seite jeder Produktionsregel steht wenigstens ein Nicht Terminalsymbol Fur einzelne Regeln schreibt man anstelle von a b P displaystyle alpha beta in P nbsp meistens a b displaystyle alpha rightarrow beta nbsp fur die Menge der Regeln mit a displaystyle alpha nbsp auf der linken Seite a b 1 a b n P displaystyle alpha beta 1 dots alpha beta n subseteq P nbsp auch a b 1 b n displaystyle alpha rightarrow beta 1 mid dots mid beta n nbsp Um die Zugehorigkeit zur Klasse der Typ 0 Grammatiken auszudrucken schreibt man G Typ 0 displaystyle G in mbox Typ 0 nbsp Von Typ 0 Grammatiken erzeugte Sprachen Bearbeiten Jede Typ 0 Grammatik erzeugt eine Sprache die von einer Turingmaschine akzeptiert werden kann und umgekehrt existiert fur jede Sprache die von einer Turingmaschine akzeptiert werden kann eine Typ 0 Grammatik die diese Sprache erzeugt Diese Sprachen sind auch bekannt als die rekursiv aufzahlbaren Sprachen oft auch semi entscheidbare Sprachen genannt d h die zugehorige Turingmaschine akzeptiert jedes Wort das in der Sprache liegt Bei einem Wort das nicht in der Sprache liegt kann es sein dass die Turingmaschine nicht terminiert d h keinerlei Auskunft uber die Zugehorigkeit des Worts zur Sprache liefert Man beachte dass sich diese Menge von Sprachen von der Menge der rekursiven Sprachen oft auch entscheidbare Sprachen genannt unterscheidet welche durch Turingmaschinen entschieden werden konnen Typ 1 Grammatik kontextsensitive Grammatik Bearbeiten Hauptartikel Kontextsensitive Grammatik Definition Bearbeiten Typ 1 Grammatiken werden auch kontextsensitive Grammatiken genannt Es handelt sich dabei um Typ 0 Grammatiken bei denen alle Produktionsregeln die Form a A b a g b displaystyle alpha A beta rightarrow alpha gamma beta nbsp oder S e displaystyle S rightarrow varepsilon nbsp haben wobei A displaystyle A nbsp ein Nichtterminal und a g b displaystyle alpha gamma beta nbsp Worter bestehend aus Terminalen T displaystyle T nbsp und Nichtterminalen N displaystyle N nbsp sind e displaystyle varepsilon nbsp bezeichnet das leere Wort Die Worter a displaystyle alpha nbsp und b displaystyle beta nbsp konnen leer sein aber g displaystyle gamma nbsp muss mindestens ein Symbol also ein Terminal oder ein Nichtterminal enthalten Diese Eigenschaft wird Langenbeschranktheit genannt Als einzige Ausnahme von dieser Forderung lasst man S e displaystyle S rightarrow varepsilon nbsp zu wenn das Startsymbol nirgends auf der rechten Seite einer Produktion auftritt Damit erreicht man dass die kontextsensitiven Sprachen auch das oft erwunschte leere Wort enthalten konnen das dann aber immer nur in einer einschrittigen Ableitung aus dem Startsymbol selbst entsteht und ohne fur alle anderen Ableitungen die Eigenschaft zu storen dass in jedem Teilschritt die Satzform langer wird oder gleich lang bleibt Ist eine Grammatik G displaystyle G nbsp kontextsensitiv so schreibt man G Typ 1 displaystyle G in mbox Typ 1 nbsp Anders als bei kontextfreien Grammatiken konnen auf der linken Seite der Produktionen kontextsensitiver Grammatiken durchaus statt einzelner Symbole ganze Symbolfolgen stehen sofern sie mindestens ein Nichtterminalsymbol enthalten Von Typ 1 Grammatiken erzeugte Sprachen Bearbeiten Die kontextsensitiven Grammatiken erzeugen genau die kontextsensitiven Sprachen Das heisst Jede Typ 1 Grammatik erzeugt eine kontextsensitive Sprache und zu jeder kontextsensitiven Sprache existiert eine Typ 1 Grammatik die diese erzeugt Die kontextsensitiven Sprachen sind genau die Sprachen die von einer nichtdeterministischen linear beschrankten Turingmaschine erkannt werden konnen das heisst von einer nichtdeterministischen Turingmaschine deren Band linear durch die Lange der Eingabe beschrankt ist das bedeutet es gibt eine konstante Zahl a displaystyle a nbsp sodass das Band der Turingmaschine hochstens a x displaystyle a cdot x nbsp Felder besitzt wobei x displaystyle x nbsp die Lange des Eingabewortes ist Monotone Grammatiken Bearbeiten Einige Autoren bezeichnen eine Grammatik schon dann als kontextsensitiv wenn bis auf die Ausnahme S e displaystyle S rightarrow varepsilon nbsp s o alle Produktionsregeln w 1 w 2 displaystyle w 1 rightarrow w 2 nbsp nur die Bedingung w 1 w 2 displaystyle left w 1 right leq left w 2 right nbsp erfullen d h dass die rechte Seite einer solchen Produktion nicht kurzer als deren linke Seite ist Haufiger findet man dafur jedoch den Begriff der monotonen Grammatik oder der nichtverkurzenden Grammatik Es erweist sich dass die monotonen Grammatiken genau wieder die kontextsensitiven Sprachen erzeugen weshalb die beiden Klassen von Grammatiken als aquivalent betrachtet werden und manche Autoren nur die eine oder die andere Grammatikklasse uberhaupt behandeln Aber nicht jede monotone Ersetzungsregel ist auch eine kontextsensitive deshalb ist auch nicht jede monotone Grammatik eine kontextsensitive Typ 2 Grammatik kontextfreie Grammatik Bearbeiten Hauptartikel Kontextfreie Grammatik Definition Bearbeiten Typ 2 Grammatiken werden auch kontextfreie Grammatiken genannt Es sind Grammatiken fur die gelten muss w 1 w 2 P w 1 N w 2 V displaystyle forall w 1 rightarrow w 2 in P w 1 in N land left w 2 in V right nbsp In jeder Regel der Grammatik muss also auf der linken Seite genau ein nicht terminales Symbol stehen und auf der rechten Seite kann eine beliebige nicht leere Folge von terminalen und nichtterminalen Symbolen aus dem gesamten Vokabular V N T displaystyle V N cup T nbsp stehen Ausserdem kann wie bei Typ 1 Grammatiken die Ausnahmeregel S e displaystyle S rightarrow varepsilon nbsp zugelassen werden wenn S displaystyle S nbsp auf keiner rechten Seite einer Regel vorkommt Man schreibt G Typ 2 displaystyle G in mbox Typ 2 nbsp Kontextfreie Grammatiken werden oft so definiert dass die rechte Seite auch leer sein darf also w 1 e P displaystyle w 1 rightarrow varepsilon in P nbsp Solche Grammatiken erfullen nicht mehr alle Eigenschaften von Typ 2 Grammatiken und stunden nicht mehr in der von Chomsky definierten Hierarchie Sie erfullen aber die Bedingungen von monotonen Grammatiken Von Typ 2 Grammatiken erzeugte Sprachen Bearbeiten Kontextfreie Grammatiken mit e displaystyle varepsilon nbsp Ausnahmeregel erzeugen genau die kontextfreien Sprachen jede Typ 2 Grammatik erzeugt also eine kontextfreie Sprache und zu jeder kontextfreien Sprache existiert eine Typ 2 Grammatik die diese erzeugt Die kontextfreien Sprachen sind genau die Sprachen die von einem nichtdeterministischen Kellerautomaten NPDA erkannt werden konnen Eine Teilmenge dieser Sprachen bildet die theoretische Basis fur die Syntax der meisten Programmiersprachen Siehe auch Backus Naur Form BNF Erweiterte Backus Naur Form EBNF ein anderes aquivalentes Schema der Bezeichnungsweisen Typ 3 Grammatik regulare Grammatik Bearbeiten Hauptartikel Regulare Grammatik Definition Bearbeiten Typ 3 Grammatiken werden auch regulare Grammatiken genannt Es handelt sich um Typ 2 Grammatiken bei denen auf der rechten Seite von Produktionen genau ein Terminalsymbol auftreten darf und maximal ein weiteres Nichtterminalsymbol Die erlaubte Stellung solcher Nichtterminalsymbole muss ausserdem uber alle Produktionen hinweg einheitlich immer vor oder immer hinter dem Terminalsymbol sein je nachdem spricht man auch genauer von linksregularen und rechtsregularen Grammatiken Sie stimmen mit den links beziehungsweise rechts linearen Grammatiken uberein wohingegen lineare Grammatiken nicht den regularen Grammatiken entsprechen Fur linksregulare Typ 3 Grammatiken muss also die Bedingung erfullt sein dass w 1 w 2 P w 1 N displaystyle forall w 1 rightarrow w 2 in P w 1 in N land nbsp w 2 T N T displaystyle w 2 in T cup NT nbsp Sie durfen also nur linksregulare Produktionen Nichtterminalsymbol auf der rechten Seite in Vorderstellung enthalten Ublicherweise gestattet man fur regulare Grammatiken wie auch fur kontextfreie Grammatiken Regeln mit leerer rechter Seite also w 1 e P displaystyle w 1 rightarrow varepsilon in P nbsp Rechtsregulare Grammatiken erfullen dagegen die analoge Bedingung w 1 w 2 P w 1 N displaystyle forall w 1 rightarrow w 2 in P w 1 in N land nbsp w 2 T T N e displaystyle w 2 in T cup TN cup varepsilon nbsp Diese enthalten also nur rechtsregulare Produktionen Nichtterminalsymbol auf der rechten Seite allenfalls in Hinterstellung Diese Bedingung druckt auch schon die Erlaubnis leerer rechter Seiten aus Linksregulare und rechtsregulare Grammatiken erzeugen genau dieselbe Sprachklasse es gibt also zu jeder linksregularen Grammatik auch eine rechtsregulare die dieselbe Sprache erzeugt und umgekehrt Man beachte dass beim Auftreten von linksregularen und rechtsregularen Produktionen in ein und derselben Chomsky Grammatik diese nicht regular ist Die Grammatiken mit sowohl linksregularen als auch rechtsregularen Produktionen erzeugen namlich eine echt grossere Sprachklasse Manche Autoren erlauben in den Definitionen fur regulare linksregulare rechtsregulare Grammatiken uberall dort wo hier in Produktionen nur ein einzelnes Nichtterminalzeichen stehen darf auch eine beliebige nichtleere terminale Zeichenkette An der Erzeugungsmachtigkeit der Klassen andert sich dadurch nichts Man schreibt G Typ 3 displaystyle G in mbox Typ 3 nbsp fur regulare Grammatiken G displaystyle G nbsp Von Typ 3 Grammatiken erzeugte Sprachen Bearbeiten Regulare Grammatiken erzeugen genau die regularen Sprachen das heisst jede Typ 3 Grammatik erzeugt eine regulare Sprache und zu jeder regularen Sprache existiert eine Typ 3 Grammatik die diese erzeugt Regulare Sprachen konnen alternativ auch durch regulare Ausdrucke beschrieben werden und die regularen Sprachen sind genau die Sprachen die von endlichen Automaten erkannt werden konnen Sie werden haufig genutzt um Suchmuster oder die lexikalische Struktur von Programmiersprachen zu definieren Ubersicht Bearbeiten Die folgende Tabelle fuhrt fur die vier Grammatiktypen auf welche Form ihre Regeln haben welchen Namen die erzeugten Sprachen haben und welche Automatentypen diese Sprachen erkennen also das Wortproblem zumindest semi entscheiden Wort in Sprache Maschine halt in akzeptierendem Endzustand Wort nicht in Sprache Maschine halt nie oder halt in nicht akzeptierendem Zustand sicher halt die Maschine also nur wenn das Wort in der Sprache ist Da in der Chomsky Hierarchie fur die Sprachmengen aber eine echte Teilmengenbeziehung gilt siehe nachster Abschnitt entscheiden z B Turingmaschinen selbstverstandlich ebenfalls das Wortproblem fur Sprachen vom Typ 1 bis 3 entscheiden heisst Wort in Sprache Maschine halt in akzeptierendem Endzustand Wort nicht in Sprache Maschine halt in nicht akzeptierendem Zustand irgendwann halt die Maschine und das Problem Wort in Sprache ist entschieden Ausserdem wird vermerkt gegenuber welchen Operationen die erzeugten Sprachen abgeschlossen sind Grammatik Regeln Sprachen Entscheidbarkeit Automaten Abgeschlossenheit 2 ZeitabschatzungTyp 0Beliebige formale Grammatik a b displaystyle alpha rightarrow beta nbsp a V T b V displaystyle alpha in V setminus T beta in V ast nbsp rekursiv aufzahlbar nicht nur rekursiv die waren entscheidbar Turingmaschine egal ob deterministisch oder nicht deterministisch displaystyle circ cap cup ast nbsp unbeschranktTyp 1Kontextsensitive Grammatik a A b a g b displaystyle alpha A beta rightarrow alpha gamma beta nbsp A N a b V g V displaystyle A in N alpha beta in V ast gamma in V nbsp S e displaystyle S rightarrow varepsilon nbsp ist erlaubt wenn es keine Regel a b S g displaystyle alpha rightarrow beta S gamma nbsp in P displaystyle P nbsp gibt kontextsensitiv Wortproblem linear platzbeschrankte nichtdeterministische Turingmaschine displaystyle complement circ cap cup ast nbsp O 2 n displaystyle O 2 n nbsp Typ 2Kontextfreie Grammatik A g displaystyle A rightarrow gamma nbsp A N g V displaystyle A in N gamma in V ast nbsp kontextfrei Wortproblem Leerheitsproblem Endlichkeitsproblem nichtdeterministischer Kellerautomat displaystyle circ cup ast nbsp O n 3 displaystyle O n 3 nbsp Typ 3Regulare Grammatik A a B displaystyle A rightarrow aB nbsp rechtsregular oderA B a displaystyle A rightarrow Ba nbsp linksregular A a displaystyle A rightarrow a nbsp A e displaystyle A rightarrow varepsilon nbsp A B N a T displaystyle A B in N a in T nbsp Nur links oder nur rechtsregulare Produktionen regular Wortproblem Leerheitsproblem Endlichkeitsproblem Aquivalenzproblem Endlicher Automat egal ob deterministisch oder nicht deterministisch displaystyle complement circ cap cup ast nbsp O n displaystyle O n nbsp Legende fur die Spalte RegelnT displaystyle T nbsp endliches Alphabet Menge der Terminalsymbole oft auch mit S displaystyle Sigma nbsp bezeichnet das aber auch V N displaystyle V cup N nbsp bedeuten kann N displaystyle N nbsp die davon disjunkte Menge der Nichtterminalsymbole gelegentlich auch Variablen genannt und mit V displaystyle V nbsp bezeichnet statt V N T displaystyle V N cup T nbsp gesamtes Vokabular S N displaystyle S in N nbsp Startsymbol e displaystyle varepsilon nbsp leeres Wort oft auch mit l displaystyle lambda nbsp bezeichnet P displaystyle P nbsp Menge von Produktionsregeln als Teilmenge eines kartesischen Produkts eine Relation displaystyle setminus nbsp Mengen Differenzbildung displaystyle ast nbsp Kleenescher Abschluss Hulle siehe Kleenesche und positive Hulle displaystyle nbsp positive Hulle z B meint g T N V displaystyle gamma in T cup N V nbsp g displaystyle gamma nbsp muss mindestens ein Symbol Terminal oder ein Nichtterminal enthaltenIn der obigen Tabelle werden somit mit lateinischen Grossbuchstaben Nichtterminalsymbole dargestellt A B N displaystyle A B in N nbsp mit lateinischen Kleinbuchstaben Terminalsymbole a T displaystyle a in T nbsp und griechische Kleinbuchstaben werden verwendet wenn es sich sowohl um Nichtterminal als auch um Terminalsymbole handeln kann Achtung Bei displaystyle ast nbsp und displaystyle nbsp kann ein griechischer Kleinbuchstabe fur Worter aus mehreren Terminal oder Nichtterminalsymbolen stehen Legende fur die Spalte Abgeschlossenheit displaystyle complement nbsp Komplementbildung displaystyle circ nbsp Konkatenation displaystyle cap nbsp Schnittmenge displaystyle cup nbsp Vereinigungsmenge displaystyle ast nbsp Kleenescher Abschluss Hulle Chomsky Hierarchie fur formale Sprachen Bearbeiten nbsp Teilmengenbeziehung der Sprachklassen in der Chomsky HierarchieEine formale Sprache ist vom Typ i displaystyle i nbsp entsprechend der Hierarchie fur Grammatiken wenn es von einer Typ i displaystyle i nbsp Grammatik erzeugt wird Formal ausgedruckt heisst das L displaystyle L nbsp ist vom Typ i 0 3 displaystyle i in 0 ldots 3 nbsp falls es eine Grammatik G Typ i displaystyle G in mbox Typ i nbsp mit L L G displaystyle L L left G right nbsp gibt Man schreibt dann L L i displaystyle L in mathcal L i nbsp In der Chomsky Hierarchie fur formale Sprachen besteht zwischen den Sprachmengen benachbarter Ebenen eine echte Teilmengenbeziehung Jede kontextsensitive Sprache ist rekursiv aufzahlbar aber es gibt rekursiv aufzahlbare Sprachen die nicht kontextsensitiv sind Ebenso ist jede kontextfreie Sprache auch kontextsensitiv aber nicht umgekehrt und jede regulare Sprache ist kontextfrei aber nicht jede kontextfreie Sprache ist regular Formal ausgedruckt bedeutet dies fur die Klassen der durch die obigen Grammatiken erzeugten Sprachen L 3 L 2 L 1 L 0 displaystyle mathcal L 3 subset mathcal L 2 subset mathcal L 1 subset mathcal L 0 nbsp wobei gelegentlich auch folgende Symbole verwendet werden R E G C F C S R E displaystyle mathrm REG subset mathrm CF subset mathrm CS subset mathrm RE nbsp Beispiele fur Sprachen in den jeweiligen Differenzmengen sind L 1 a n b n c n n 1 displaystyle L 1 left a n b n c n n geq 1 right nbsp ist vom Typ 1 aber nicht vom Typ 2 L 2 a n b n n 1 displaystyle L 2 left a n b n n geq 1 right nbsp ist vom Typ 2 aber nicht vom Typ 3Beweise fur die Nichtzugehorigkeit bestimmter Sprachen zu den Sprachklassen L 2 displaystyle mathcal L 2 nbsp und L 3 displaystyle mathcal L 3 nbsp wie hier werden oft mit dem Schleifensatz gefuhrt Naturliche Sprachen Bearbeiten nbsp Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen beispielsweise Einzelnachweisen ausgestattet Angaben ohne ausreichenden Beleg konnten demnachst entfernt werden Bitte hilf Wikipedia indem du die Angaben recherchierst und gute Belege einfugst Obwohl Chomsky seine Forschungen mit dem Ziel verfolgte eine mathematische Beschreibung der naturlichen Sprachen zu finden ist bis heute fur keine naturliche Sprache der Nachweis einer korrekten und vollstandigen formalen Grammatik gelungen 3 Das Problem besteht u a im Zusammenspiel der verschiedenen Grammatikteile die jeweils einzelne sprachliche Phanomene modellieren Aber auch beim praktischen Einsatz formaler Grammatiken in der Computerlinguistik kann es zu Mehrdeutigkeiten auf verschiedenen Ebenen der Sprachbetrachtung kommen diese mussen z B in der maschinellen Ubersetzung anhand des Kontextes aufgelost werden Literatur BearbeitenNoam Chomsky Three models for the description of language In IRE Transactions on Information Theory Vol 2 1956 S 113 124 chomsky info PDF Noam Chomsky On certain formal properties of grammars In Information and Control Vol 2 1959 S 137 167 diku dk PDF Noam Chomsky Marcel P Schutzenberger The algebraic theory of context free languages Computer Programming and Formal Languages Hrsg P Braffort D Hirschberg North Holland Amsterdam 1963 S 118 161 Peter Sander Wolffried Stucky Rudolf Herschel Automaten Sprachen Berechenbarkeit Teubner Stuttgart 1992 ISBN 3 519 02937 5 Einzelnachweise Bearbeiten Im Zusammenhang mit formalen Grammatiken wird hier fur das Zielalphabet der Terminalsymbole das Zeichen T displaystyle T nbsp statt wie sonst S displaystyle Sigma nbsp verwendet Achtung Manche Autoren bezeichnen mit S displaystyle Sigma nbsp abweichend das Gesamtvokabular N T displaystyle N cup T nbsp hier mit V displaystyle V nbsp bezeichnet Uwe Schoning Theoretische Informatik kurz gefasst 5 Auflage Spektrum Akademischer Verlag Heidelberg 2008 ISBN 978 3 8274 1824 1 S 81 John Spacey Natural Language vs Formal Language In Simplicable 12 April 2017 abgerufen am 6 September 2021 englisch Normdaten Sachbegriff GND 4529323 5 lobid OGND AKS Abgerufen von https de wikipedia org w index php title Chomsky Hierarchie amp oldid 234694669