www.wikidata.de-de.nina.az
Eine Auszeichnungssprache englisch markup language abgekurzt ML ist eine maschinenlesbare Sprache fur die Gliederung und Formatierung von Texten und anderen Daten Der bekannteste Vertreter ist die Hypertext Markup Language HTML die Kernsprache des World Wide Webs 1 Mit Auszeichnungssprachen werden Eigenschaften Zugehorigkeiten und Darstellungsformen von Abschnitten eines Textes Zeichen Wortern Absatzen usw Elementen oder einer Datenmenge beschrieben Dies geschieht in der Regel indem sie mit Tags markiert werden Der Artikel behandelt besonders die mit der Standard Generalized Markup Language SGML empfohlene Trennung von Struktur und Darstellung Inhaltsverzeichnis 1 Wortherkunft und Geschichte 2 Wie ausgezeichneter Text aussieht 2 1 Grundzuge 2 2 Ergebnis und Code in Beispielen 2 3 Beispiele darstellender gegenuber beschreibender Auszeichnung 3 Innere Systematik Abstraktionsstufen 3 1 Darstellend gegenuber beschreibend Ubersicht 3 2 Popularitat beschreibender Auszeichnung Vorteile historische Entwicklung 3 3 Definition als Sprache 3 4 Prozedural und prasentational 3 5 Prozedurale und deskriptive Auszeichnungssprachen 3 6 Darstellungsstufen 3 7 Implementierung der Stilvariation bei generischer Auszeichnung 3 7 1 Implementierung einer Darstellungsweise 3 7 2 Darstellungsanderung 3 7 3 Fazit Worin besteht die Trennung von Inhalt und Darstellung 3 8 Automatische Codeerzeugung und ursprunglicher Quellcode 3 9 Vereinfachte Auszeichnungssprachen 3 9 1 Merkmale 3 9 2 Historische Entwicklung 3 9 3 Daten 4 Aussere Systematik Einordnung als Programmiersprache oder Datenformat 5 Literatur 6 Weblinks 7 Anmerkungen 8 EinzelnachweiseWortherkunft und Geschichte BearbeitenDer typografische Begriff Auszeichnung kommt aus der Druckersprache Ursprunglich war damit lediglich die Methode gemeint Teile eines Textes durch von der Grundschrift abweichende Schriften zu gestalten z B durch andere Schriftgrossen und arten aber auch durch Unterstreichen Sperren oder andere Druckfarben Fur den Schriftsetzer wurden die entsprechenden Stellen fruher handschriftlich auf dem zugehorigen Manuskript kenntlich gemacht auch dies wurde Auszeichnen genannt 2 Mit der Weiterentwicklung der Typografie fur digitale Texte wurden daraus maschinenlesbare Sprachen und das Konzept wurde auf Fussnoten Literaturhinweise Absatze Uberschriften etc erweitert Dann wurde der Gedanke der Trennung von Inhalt und Form ursprunglich ein Schlagwort der Formalen Soziologie popular so dass in den Quelltexten fur Dokumente Hinweise auf die Formatierung von Textteilen mehr und mehr durch Kennzeichnungen der Art von Information ersetzt wurden die jeweils mitgeteilt werden sollte Dies fuhrte 1986 zu SGML als internationalem Auszeichnungsstandard ISO 8879 und 1998 zur Spezifikation von XML durch das World Wide Web Consortium XML wurde in den folgenden Jahren auch fur andere Zwecke als fur die Formatierung von Textdokumenten eingesetzt etwa fur Datenformate Datenserialisierung Wie ausgezeichneter Text aussieht BearbeitenGrundzuge Bearbeiten Typische Auszeichnungssprachen kennzeichnen Teile von Texten oder anderen Daten mit Tags Die Quelltexte dafur werden mit einem computerlesbaren Zeichensatz verfasst in der Regel ASCII oder UTF 8 Oft bietet die Sprache auch die Moglichkeit Sonderzeichen zu beschreiben meist mit Hilfe einer numerischen Zuweisung Unicode oder durch Benennung benannte Zeichenentitaten fur µ zum Beispiel span class k mu span in LaTeX und span class ni amp micro span in HTML Ergebnis und Code in Beispielen Bearbeiten Beispiel fur Darstellungs beispiel HTML LaTeX MediaWiki WikitextUberschrift Abschnitt span class p lt span span class nt h2 span span class p gt span Abschnitt span class p lt span span class nt h2 span span class p gt span span class k section span span class nb span Abschnitt span class nb span span class k span Abschnitt span class k span Aufzahlung Punkt 1 Punkt 2 Punkt 3 lt ul gt lt li gt Punkt 1 lt li gt lt li gt Punkt 2 lt li gt lt li gt Punkt 3 lt li gt lt ul gt begin itemize item Punkt 1 item Punkt 2 item Punkt 3 end itemize span class k span Punkt 1 span class k span Punkt 2 span class k span Punkt 3Hyperlink W3C span class p lt span span class nt a span span class na href span span class o span span class s http www w3 org span span class p gt span W3C span class p lt span span class nt a span span class p gt span span class k href span span class nb span https www w3 org span class nb span W3C span class nb span span class k span http www w3 org W3C span class k span fetten Text fett span class p lt span span class nt b span span class p gt span fett span class p lt span span class nt b span span class p gt span span class k textbf span span class nb span fett span class nb span span class k span fett span class k span kursiven Text kursiv span class p lt span span class nt i span span class p gt span kursiv span class p lt span span class nt i span span class p gt span span class k textit span span class nb span kursiv span class nb span span class k span kursiv span class k span Der Hyperlink mit LaTeX funktioniert nicht allgemein jedenfalls aber mit dem Zusatzpaket hyperref und bei Erzeugung eines Ergebnisses im PDF Format Beispiele darstellender gegenuber beschreibender Auszeichnung Bearbeiten Fett und kursiv in der vorigen Tabelle bedeuten eine bestimmte Darstellung Formatierung hier konkret Wahl eines Schriftschnitts wahrend Uberschrift ein semantisches Merkmal ist und im Allgemeinen keine Darstellung etwa als fett festlegt In Druckwerken werden Uberschriften statt durch Fetten auch durch Kapitalchen oder Kursivstellung formatiert Zu HTML und LaTeX gibt die vorige Tabelle daher fur fett und kursiv den Code fur die Schriftauszeichnung an 3 tatsachlich erzeugt die MediaWiki Software der Wikipedia aus dem Wikitext fett den HTML Code span class p lt span span class nt b span span class p gt span fett span class p lt span span class nt b span span class p gt span Anm 1 Im Gegensatz dazu bietet HTML die semantische Auszeichnung durch strong an was Wichtigkeit ausdrucken soll 4 Beispiel HTML Ergebnis mit Voreinstellungen span class p lt span span class nt strong span span class p gt span wichtig span class p lt span span class nt strong span span class p gt span wichtig Das HTML Element strong wird also normalerweise in Browser Voreinstellungen durch fetten Text dargestellt 5 Analog zum Verhaltnis des HTML Elements b zum HTML Element strong ist die Beziehung des HTML Elements i zu em Dieses Element steht fur Betonung seine voreingestellte Darstellung ist Kursivstellung 6 In LaTeX gibt es ebenfalls eine semantische Variante span class k emph span der Darstellungsauszeichnung span class k textit span 7 8 HTML LaTeX Ergebnis mit Voreinstellungen lt body gt eine lt em gt Betonung lt em gt in normaler Umgebung lt body gt begin document eine emph Betonung in normaler Umgebung end document eine Betonung in normaler UmgebungInnerhalb eines kursiv gesetzten Texts aber ist Kursivstellung zur Betonung ungeeignet LaTeX berucksichtigt das HTML Ergebnis mit Voreinstellungen span class p lt span span class nt i span span class p gt span eine span class p lt span span class nt em span span class p gt span Betonung span class p lt span span class nt em span span class p gt span in kursiver Umgebung span class p lt span span class nt i span span class p gt span eine Betonung in kursiver Umgebung span class k textit span span class nb span eine span class k emph span span class nb span Betonung span class nb span in kursiver Umgebung span class nb span eine Betonung in kursiver UmgebungLaTeX ErgebnisWikitext verhalt sich hier in gewisser Weise wie LaTeX in HTML kann das Verhalten von LaTeX durch die CSS Deklaration span class nt i span span class w span span class nt em span span class w span span class p span span class w span span class k font style span span class p span span class w span span class kc normal span span class p span span class w span span class p span ansatzweise erzielt werden Nach HTML5 Spezifikation soll Verschachtelung von em Elementen verstarkte Betonung ausdrucken 9 was anscheinend noch kaum implementiert ist LaTeX hingegen schaltet bei Verschachtelung von span class k emph span nur zwischen Kursiv und Aufrechtstellung hin und her so dass beim Lesen dreifache Betonung von einfacher Betonung nicht zu unterscheiden ist Letztlich sind demnach gebrauchliche und gleichzeitig sinnvolle Implementierungen von Betonung in HTML nur fur die einfachsten Falle und in LaTeX nur fur die einfachsten und die zweiteinfachsten Falle bekannt Bei HTML wurde lange angestrebt darstellende der Jargon ist in diesem Falle prasentationale Elemente abzuschaffen Anm 2 HTML4 Varianten strict 10 vs transitional Mit HTML5 soll dieses Ziel erreicht sein 11 obwohl b und i immer noch vorhanden sind fur Falle in denen Fetten bzw Kursivstellung dringend erwunscht ist Eine Aufzahlung von Fallen in denen die konkrete Schriftschnittwahl angebracht ist wird als semantische Definition der beiden Elemente betrachtet 12 Innere Systematik Abstraktionsstufen Bearbeiten Darstellend gegenuber beschreibend Ubersicht Bearbeiten 1981 unterschied Charles Goldfarb auf einer Konferenz 13 der Lausanne Konferenz 14 und in einem einflussreichen 15 Artikel 16 zwischen prozeduraler englisch procedural markup und deskriptiver beschreibender englisch descriptive markup Auszeichnung von Dokumenten 1987 wurde prasentational englisch presentational markup im Zusammenhang mit WYSIWYG Textverarbeitung als weitere Art Text auszuzeichnen genannt 17 18 19 Recht bald 20 wurde prasentational jedoch als mit prozedural synonym oder als Oberbegriff davon dazu unten Prozedural und prasentational verwendet wir nennen das hier darstellend Letzteres bestimmt die Textformatierung also etwa die Schriftauszeichnung durch Wahl einer Schriftart eines Schriftschnitts des Schriftgrads einer Schriftfarbe oder einer Unterlegung auch die Ausrichtung von Text relative Abstande absolute Position auf der Seite 21 Weitere Synonyme wurden spater haufiger verwendet 22 zu darstellend prasentational visuell physisch spezifisch zu deskriptiv strukturell deklarativ verallgemeinert generalized generisch inhaltlich logisch konzeptuell englisch conceptual markup 23 semantisch Der Ausdruck generic coding anstelle von descriptive markup stammt von William W Tunnicliffe Furuta verwendete 1992 zur Darstellung von Goldfarbs und Brian Reids s u Unterscheidung nicht prozedural und deskriptiv sondern prasentational und generisch 15 ausserdem separation between content specification and format specification 18 und zu generisch logical structure rather than its physical appearance 24 In den Spezifikationen und Entwurfen zu HTML 4 0 und HTML 4 01 ist das vorherrschende Gegensatzpaar prasentational auch presentation elements and attributes 25 versus strukturell 25 Separate structure and presentation 26 auch von visual formatting ist die Rede 21 Zu Beginn seines Artikels erklart Goldfarb 27 das Markup trenne die logischen Elemente voneinander und gebe typischerweise wohl in Bezug auf das bis dahin bekannte prozedurale Markup die Verarbeitungsfunktionen processing functions an die auf diese Elemente angewendet werden sollen Popularitat beschreibender Auszeichnung Vorteile historische Entwicklung Bearbeiten Goldfarb William W Tunnicliffe und Brian Reid empfahlen damals 15 Dokumente beim Verfassen nur beschreibend auszuzeichnen z B Phrasen und Blocke nur als Titel Abschnittsuberschrift Blockzitat usw zu kennzeichnen um typografisch hochwertigen Satz auch ohne typografische Fachkenntnisse und Programmierkenntnisse der Verfasser zu ermoglichen den Darstellungsstil mit geringem Aufwand andern zu konnen nicht auf bestimmte Werksatzanbieter angewiesen zu sein und um automatische Informationsgewinnung zu erleichtern etwa um beim Durchsuchen von Dokumenten nach Stichwortern Vorkommnisse in Uberschriften starker zu gewichten Goldfarb 27 weist etwa darauf hin dass durch die blosse Kennzeichnung von Wortern als zu zentrieren die Information verloren geht ob es sich um eine Uberschrift oder die Beschriftung einer Tabelle oder Abbildung handelt Deskriptive Auszeichnung erleichtert auch die Darstellung in unterschiedlichen Ausgabeformaten geraten wie HTML PDF und Screenreader Barrierefreiheit vgl Accessible Rich Internet Applications 11 Im Falle von HTML kann die Nutzung prasentationaler Attribute anstelle von Stylesheets auch die HTML Dateien aufblahen Entsprechend wurde spater bei HTML darauf hingearbeitet nur strukturelle oder semantische Elemente und Attribute anzubieten und die Darstellung vollig in die Cascading Style Sheets auszulagern Trennung von Inhalt und Form William W Tunnicliffe sprach sich bereits 1967 auf einer Konferenz fur die Trennung von Inhalt und Form in der Textverarbeitung aus was jedoch zunachst geringe Wirkung hatte immerhin gibt Goldfarb an davon beeinflusst worden zu sein 1981 stellte Brian Reid sein Satzsystem Scribe in derselben Sitzung der Lausanne Konferenz vor in der Goldfarb seine Ideen vorstellte 13 Scribes Trennung von Inhalt und Form atierung beeindruckte als besonders gut gelungen 18 In den nachsten Jahren entwickelte Leslie Lamport das Makropaket LaTeX fur das TeX Programm besonders mit der Motivation ebenfalls Autoren eine deskriptive Auszeichnungssprache anzubieten 28 1985 wurde es veroffentlicht Bereits 1992 war LaTeX sehr popular 15 zunachst unter nordamerikanischen Mathematikern in den nachsten Jahren uberhaupt im wissenschaftlich akademischen Bereich und in der Industrie 29 In den nachsten Jahren ubernahm ein fast rein europaisches Entwicklungsteam die Weiterentwicklung von LaTeX von Lamport und verbesserte seine Flexibilitat hinsichtlich Verwendung unterschiedlicher Stylesheets Makrodefinitionsdateien mit Endungen sty fur style wie bei Lamport und cls fur die Deklaration der Dokumentenklasse mit documentclass und hinsichtlich der Verwendung mit nicht englischen Sprachen wodurch die Bedeutung von LaTeX noch gesteigert wurde 30 Tunnicliffe und Goldfarb fuhrten dagegen die Weiterentwicklung von IBM Generalized Markup Language zu SGML als Grundlage fur die Definition rein deskriptiver Auszeichnungssprachen an woraus spater XML entstand das im Werksatz ebenfalls eine bedeutende Rolle spielt Definition als Sprache Bearbeiten Eine Auszeichnungssprache sollte eine Sprache sein die auch maschinenlesbar ist Dazu mussen jeweils Syntax und Semantik angegeben werden was in folgenden Fallen zutrifft Der Quellcode eines Dokuments ist ein Programm mit Anweisungen einer domanenspezifischen Programmiersprache Syntax und Semantik sind also wie bei anderen Programmiersprachen auch definiert und bilden eine formale Sprache deren Syntax etwa durch Produktionsregeln etwa in Backus Naur Form gebildet wird Dies gilt etwa fur PostScript troff und TeX fur dieses auf Token Ebene nach Expansion von Makros u a 31 Bei gemass SGML bzw XML definierten Auszeichnungssprachen wird jedenfalls die Syntax prazise durch eine Dokumenttypdefinition dargestellt Unter Umstanden gibt das World Wide Web Consortium auch eine informelle Semantik an die aus an Nutzer und Entwickler gerichteten Empfehlungen besteht Etwas schwieriger ist es im Fall von TeX und LaTeX wo durch Makrodefinitionen hauptsachlich vor dem Einlesen des Codes der den Inhalt eines Dokuments darstellt eine sehr umfangreiche prozedurale Sprache wir greifen etwas vor entsteht Durch die Wahl sprechender Makronamen entsteht jedenfalls eine Illusion von rein deskriptiver Auszeichnung Durch Verschweigen im Handbuch oder Verbieten Anm 3 der durchaus verfugbaren Moglichkeiten prozeduraler oder prasentationaler Auszeichnung kann man zu einer rein deskriptiven Auszeichnungssprache gelangen Auf ahnliche Weise war HTML 4 01 Strict eine durch Verbieten prasentationaler von Browsern aber weiterhin interpretierter Elemente und Attribute eine rein deskriptive Auszeichnungssprache Prozedural und prasentational Bearbeiten In einem bedeutenden 15 Aufsatz von 1987 17 wurden neben prozedural und deskriptiv weitere Auszeichnungsarten beschrieben von denen der XML Koautor Tim Bray in seinem Blog 19 prasentational ubernahm Gemeint war mit letzterem solches Markup das von WYSIWYG Textverarbeitungsprogrammen automatisch in den Dokument Quellcode eingefugt wurde wenn Nutzer bestimmte Tastenkombinationen eingaben genannt wird WordStar Statt des Quellcodes bekommt der Nutzer aber nur eine Vorschau der Druckausgabe zu sehen Prasentational hat hierbei offenbar eine andere speziellere Bedeutung als in den HTML Spezifikationen in denen keine Rede von WYSIWYG Editoren ist Eine Gemeinsamkeit besteht aber darin dass der Auszeichnungscode knapper ist als der fur auffallig prozedurales Markup in folgendem Sinne In dem von Goldfarb 27 angegebenen Beispiel geht einer Liste wie sie etwa in HTML mit span class p lt span span class nt ol span span class p gt span eingeleitet wird folgender Code voraus tb 4 of 4 sk 1 Die ersten beiden Zeilen stellen dabei Wertzuweisungen fur Parameter dar die den hangenden Einzug des folgenden Absatzes steuern die dritte Zeile erzeugt dessen vertikalen Abstand zum vorhergehenden Absatz Die dabei verwendete Auszeichnungssprache ist das troff ahnliche SCRIPT Es handelt sich offenbar um einen Teil eines Computerprogramms in einer imperativen Programmiersprache span class p lt span span class nt ol span span class p gt span in HTML ist kurzer und verzichtet auf Details der Formatierung Das Beispiel ist allerdings nur dazu geeignet Goldfarbs Vorstellung von prozeduraler Auszeichnung anzudeuten und illustriert nur den Unterschied zur deskriptiven Auszeichnung Bray illustriert prozedurales Markup mit den PostScript Befehlen span class nf gsave span und span class nf grestore span 32 Diese beiden Befehle verhalten sich zueinander wie span class k begingroup span und span class k endgroup span in TeX 33 34 Die Anweisung span class k begingroup span bewirkt dass bei jeder folgenden Parameterwertanderung der vorige Parameterwert in einem Stapelspeicher abgelegt wird Der entsprechende Befehl span class k endgroup span stellt die Parameterwerte vor dem entsprechenden span class k begingroup span wieder her Beide Befehle haben keine unmittelbare Auswirkung auf die Formatierung die Wirkung hangt vielmehr davon ab die Werte welcher Parameter zwischen ihnen geandert werden In PostScript gibt es ausserdem den Befehl span class nf selectfont span der an den LaTeX Befehl span class k selectfont span erinnert Anm 4 Courier 20 selectfont 72 500 moveto Hallo Welt show showpage Insgesamt legen die vorigen Beobachtungen folgendes Beispiel nahe Kursivstellung mit HTML und LaTeX letzteres mit high level gegenuber low level Befehlen Darstellung HTML LaTeX high level LaTeX mit begingroup LaTeX mit statt begingroupkursiv gesetzt lt body gt lt i gt kursiv lt i gt gesetzt lt body gt begin document textit kursiv gesetzt end document begin document begingroup fontshape it selectfont kursiv endgroup gesetzt end document begin document fontshape it selectfont kursiv gesetzt end document Die beiden low level Beispiele rechts kommen dem sehr nahe wie LaTeX den high level Befehl span class k textit span tatsachlich umsetzt span class k endgroup span gesetzt wurde in kursivgesetzt resultieren daher wird span class k endgroup span verwendet Die Notwendigkeit dieses Tricks vermeidet man im rechten Beispiel wo die geschweiften Klammern die Befehle span class k begingroup span und span class k endgroup span vertreten wahrend sie nach span class k textit span nur dessen Anwendungsbereich angeben Der Befehl span class k span verhindert dass durch die Rechtsneigung des v der Abstand zwischen kursiv und gesetzt optisch zu eng ausfallt sogenannte Kursivkorrektur In allen vier Beispielen liegt eine darstellende Auszeichnung vor die den Schriftschnitt variiert Einer der Nachteile prozeduraler Auszeichnung die Goldfarb nennt 35 soll darin bestehen dass sie die Beherrschung einer Vielzahl von Programmierbefehlen erfordert als Beispiel nennt er ausdrucklich Knuths TeX Die Kursivkorrektur ist auch eine typografische Feinheit deren Notwendigkeit bei der Nutzung von TeX fur Autoren nicht selbstverstandlich ist Der LaTeX Befehl span class k textit span erspart dem Anwender die Kenntnis einiger low level Befehle und der Kursivkorrektur Das i Element in HTML ist ebenso einfach zu beherrschen Goldfarbs hier angesprochener Kritikpunkt richtet sich im Unterschied zu anderen offenbar nicht gegen jede darstellende Auszeichnung sondern nur gegen programmiersprachenartige Auszeichnung wie in den beiden Beispielen rechts und gegen PostScript Befehle weiter oben Im Falle des HTML Beispiels erscheint die Bezeichnung der Auszeichnung durch span class p lt span span class nt i span span class p gt span und span class p lt span span class nt i span span class p gt span als prozedural auch unpassend Wahrend in den umstandlichen Beispielen einzelne Befehle an den Textprozessor gerichtet werden Goldfarb processing functions 27 die erst durch ihre Kombination die gewunschte Darstellung erreichen stellt das i Element nur eine abstrakte Schnittstelle zum Webbrowser dar dessen prozedurale Verarbeitung des linken Beispiels fur Verfasser von HTML Dokumenten gar nicht zuganglich ist Der Unterschied ahnelt dem zwischen imperativer Programmierung echt prozedural in den rechten Beispielen und deklarativer Programmierung in der die Algorithmen zum Erreichen eines beschriebenen Zustands hier Kursivschrift nicht explizit genannt werden Prozedurale und deskriptive Auszeichnungssprachen Bearbeiten In der Literatur wird auch von deskriptiven Auszeichnungssprachen englisch descriptive markup languages 22 im Gegensatz zu prozeduralen Auszeichnungssprachen englischprocedural markup languages gesprochen 22 wann eine Aussprache prozedural bzw deskriptiv ist soll vielleicht im Anschluss an Erlauterungen von prozeduraler Auszeichnung bzw deskriptiver Auszeichnung selbstverstandlich sein Eine deskriptive Auszeichnungssprache durfte eine Auszeichnungssprache sein die weder prozedurales noch prasentationales Markup ermoglicht also rein deskriptiv ist wie es die Intention Philosophie 22 von SGML war Dies trifft auf DocBook und TEI zu Das Pradikat prozedurale Auszeichnungssprache scheint auf Auszeichnungssprachen zuzutreffen in denen Wertzuweisungen und andere Ahnlichkeiten mit imperativen Programmiersprachen unubersehbar sind vielleicht auch auf Auszeichnungssprachen die Formatierungsanweisungen in eher deklarativer Weise geben wie HTML vor HTML5 Jedenfalls konnten PostScript TeX und troff dazu gezahlt werden 32 Die vorige Deutung steht allerdings im Widerspruch dazu dass LaTeX laut Furuta 18 und dem 1994er LaTeX Begleiter 36 in hohem Masse eine generische Markup Sprache sein soll trotz des darstellenden span class k textit span mit dem im LaTeX Begleiter beschriebenen LaTeX 2e bzw span class k it span mit dem 1992 gultigen LaTeX 2 09 Vielleicht ist eine generische oder deskriptive Markup Sprache doch eine Sprache die neben prasentationalem Markup auch ein gewisses Mass an generischem Markup bietet Darstellungsstufen Bearbeiten Auf eine Arbeit von 1988 unter seiner Beteiligung Bezug nehmend spricht Furuta 37 von drei Erscheinungsformen representations eines Dokuments einer abstrakten die durch Bearbeitung mit einem Editor verandert wird abstract representation einer physischen die aus einer abstrakten durch Formatierung entsteht physical representation und einer Seitenerscheinungsform die fur ein bestimmtes Ausgabegerat erforderlich ist page representation Entsprechend ist Furutas Artikel gegliedert Durch darstellendes Markup kann man wie oben dargelegt beginnend mit Beispiele Schriftschnitt Farben und Textausrichtung bestimmen ein entsprechender Abschnitt in den Spezifikationen zu HTML 4 0 und 4 01 21 beschreibt diesen physischen Aspekt einigermassen umfassend In HTML5 ist mit dem style Attribut eine Moglichkeit verblieben z B Schriftschnitte durch CSS Code zu wahlen auch Tabellen bewirken eine physisch einigermassen strikte Darstellung die der seitenorientierten Darstellung naher kommt als die Wahl von Schriftschnitten Auszeichnung dieser Art entspricht dem ursprunglichen engeren Begriff Textformatierung bzw traditionelles Auszeichnen wie am Anfang des Artikels beschrieben Was bei solcher Auszeichnung im Allgemeinen nicht bestimmt wird ist in einem Fliesstextabsatz der Zeilenumbruch Bei einem Wort ab der Mitte eines langeren Absatzes lasst man sich davon uberraschen ob es im dargestellten Absatz auf dem Bildschirm oder auf der ausgedruckten Seite eher links oder eher rechts steht oder ob es beim Zeilenumbruch getrennt wird So ist es auch bei der ublichen Verwendung von LaTeX ConTeXt und plain TeX Bei Bedarf kann man mit etwas fortgeschrittenen Kenntnissen die Zeilen eines Absatzes manuell fixieren bei Webseiten mit span class nt white space span span class o span span class w span span class nt nowrap span und span class p lt span span class nt br span span class p gt span bei LaTeX mit span class k makebox span und span class k linebreak span Haufiger ist man in einzelnen Fallen mit dem automatischen Zeilenumbruch nicht zufrieden und legt einen Zeilenwechsel manuell fest oder man unterbindet einen Zeilenumbruch innerhalb einer Phrase Neben dem Zeilenumbruch werden auch die Zeilenabstande typischerweise automatisch bestimmt sie sollten gleichmassig sein etwa bei mathematischen Formeln mit Bruchen mussen sie aber oft grosser gewahlt werden TeX trat auch mit der Besonderheit hervor die Zeichen in mathematischen Formeln in verschiedenen Grossen zu setzen und relativ zueinander zu so anzuordnen dass die Proportionen hohen typografischen Anspruchen genugen Gegenuber Webseiten muss im Drucksatz zusatzlich der Seitenumbruch bestimmt werden Auch den uberlasst man meist dem Satzprogramm und korrigiert das automatische Ergebnis gelegentlich manuell Bei der Gestaltung der Titelseite eines Buchs uberlasst man dagegen nichts dem Zufall Dateiformate die alle Zeilenumbruche in Fliesstexten einer Ausgabeseite und auch die exakte Position von Textelementen und Grafiken auf ihr fixieren und festlegen heissen oder entsprechen Seitenbeschreibungssprachen 38 Solche sind etwa PostScript und PDF von Adobe das ursprungliche Ausgabeformat DVI von TeX oder XML Paper Specification von Microsoft weitere im Hauptartikel PDF und DVI kann man allerdings nicht in einem Texteditor betrachten und andern oder verfassen In Postscript ist dies moglich man kann im Prinzip ein Buch in PostScript verfassen und bestimmt dabei ahnlich wie mit der Schreibmaschine die exakten Positionen aller Zeichen auf den einzelnen Seiten 39 In der Praxis werden PostScript Dateien eher etwa aus mit LaTeX ausgezeichneten Quelltextdateien erzeugt indem man die von TeX erzeugte DVI Datei mit einem weiteren Programm dvips in PostScript umwandelt Im Allgemeinen versieht also der Verfasser den Text nur mit deskriptivem oder auch physischem Markup in einem Editor ohne Zeilen Seitenumbruche festzulegen diese und weitere Anordnungsweisen werden vielmehr automatisch erzeugt und unter Umstanden in einer Seitenbeschreibungsdatei abgelegt Seitenbeschreibungsdateien kann man mit einem Viewer wie Ghostview Postscript Adobe Reader PDF oder YAP fur DVI unter Windows bzw xdvi fur DVI unter Linux vgl DVI Betrachter als Vorschau am Bildschirm betrachten und ausdrucken lassen Sie sind auch fur den elektronischen Austausch von Dokumenten bzw ihre Verbreitung Online Publikation gegenuber den Quellformaten vorteilhaft da sie dem Empfanger das Neuerzeugen der Ansichtsversion des Dokuments was sogar scheitern kann ersparen Austauschformate Die Seitenerscheinungsform oder Seitendarstellung eines Dokuments muss jedoch nicht als eigene Seitenbeschreibungsdatei vorliegen Bei manchen Editoren kann konnte man sie direkt am Bildschirm betrachten oder ausdrucken troff wurde zu ditroff erweitert das eine eigene Seitenbeschreibungsdatei erzeugen kann andere Textverarbeitungsprogramme wurden mit der Moglichkeit ausgestattet PDF zu erzeugen Bei Webbrowsern genauer HTML Renderern und E Book Readern die etwa HTML oder EPUB darstellen wird die Seitendarstellung der Umbruch von Fliesstextabsatzen schnell an sich andernde Fensterbreiten oder Schriftgrossen angepasst Implementierung der Stilvariation bei generischer Auszeichnung Bearbeiten Implementierung einer Darstellungsweise Bearbeiten Fur die Formatierung generisch ausgezeichneten Texts werden allgemeine Regeln zur Behandlung der einzelnen Tags eventuell abhangig von Attributen bei SGML artigen Auszeichnungssprachen in einer formalen Sprache in einer Art Programm festgelegt Entsprechende Regeldateien werden im SGML Umfeld Stylesheets genannt bei LaTeX nicht Zum Teil oder in einem ersten Schritt besteht die Formatierung darin die generische Sprache in eine prasentationale zu ubersetzen Im Falle von HTML wird die Formatierung einzelner Elemente durch entsprechende Anweisungen in CSS Code bestimmt Beispielsweise besagt die CSS Zeile span class nt body span span class w span span class p span span class w span span class k color span span class p span span class w span span class kc blue span span class p span span class w span span class k background color span span class p span span class w span span class kc yellow span span class p span span class w span span class p span dass eine HTML Datei mit blauem Text auf gelbem Grund dargestellt werden soll und mit span class nt em span span class w span span class p span span class w span span class k color span span class p span span class w span span class kc red span span class p span span class w span span class p span soll der Text in em Elementen rot sein In folgendem Beispieldokument lt head gt lt title gt Hallo Welt lt title gt lt style type text css gt body color blue background color yellow em color red lt style gt lt head gt lt body gt lt em gt Hallo lt em gt Welt lt em gt Horst lt em gt du lt body gt erscheint dieser CSS Code in einem style Element innerhalb des head Elements Das Ergebnis sollte in etwa Hallo Welt Horst du sein und das gleiche wie mit lt head gt lt title gt Hallo Welt lt title gt lt head gt lt body style color 000 p lt span span class nt body span span class p gt span durch span class p lt span span class nt body span span class na style span span class o span span class s color 000 span span class p gt span ersetzt und jedes em Tag generisches Markup der ersten Datei wurde durch das prasentationale span class p lt span span class nt em span span class na style span span class o span span class s color 000 span span class p gt span ersetzt Die CSS Anweisung i tag i i stil i wirkt also wie das Einfugen von style i stil i in alle i tag i Anfangstags Was HTML Renderer tatsachlich tun um CSS und HTML zusammenzufuhren kann hier nicht dargestellt werden Immerhin handelt es sich bei den Beispieldateien sogar um XHTML also Code einer XML Sprache und die Ubersetzung stellt eine Transformation dar die wiederum leicht missbrauchlich durch XSL Transformation XSLT dargestellt werden konnte XSL steht fur Extensible Stylesheet Language Im Falle von XML besteht die puristische Anwendung von XSL und XSLT darin generische XML Sprachen gemass XSL Stylesheets in die prasentationale Sprache XSL FO XSL Formatting Objects zu ubersetzen In einfachen Fallen bedeutet das wie oben Ersetzen generischer durch prasentationale Tags Genaueres ist den Artikeln zu entnehmen auf die eben verwiesen wurde XSL FO ist selbst noch keine Seitenbeschreibungssprache und muss zum Ausdrucken erst etwa in eine PDF Datei umgewandelt werden Eine XSL Transformation erzeugt aus generischem Quellcode eines Dokuments tatsachlich eine Datei in einem anderen Textformat Im Falle von LaTeX aber ist es ahnlich wie bei HTML Renderern generische Befehle werden in prasentationale bzw schliesslich prozedurale ubersetzt allerdings intern auf Tokenebene span class k emph span span class nb span Hallo span class nb span wird zu einer Tokenkette emph 1H11a11l11l11o11 12 2 dann werden die beiden ersten Token und das letzte nach und nach durch einige andere ersetzt wenn einige Prufungen uberstanden sind und die Neigung der umgebenden Schrift nicht positiv ist resultiert eine ahnliche Tokenkette wie begingroupitshapeH11a11l11l11o11 12 endgroup wobei sich unter Standardeinstellungen itshape wie fontshape gt i11t11 2selectfont verhalt Das Resultat ware dasselbe wie das der prozeduralen Version von span class k textit span im Abschnitt Prozedural und prasentational Im Gegensatz zum Document Object Model bei dem das Dokument erst ubersetzt wird nachdem es komplett im Speicher reprasentiert ist verarbeitet die TeX Engine Datenstrome wie den Quellcode die Tokenketten und weitere interne Listen in moglichst kurzen Abschnitten und entledigt sich nach Ausgabe einer Druckseite weitgehend der dafur benotigten Speicherinhalte so konnten schon vor Jahrzehnten dicke Bande gesetzt werden Im Falle von LaTeX wie von TeX uberhaupt und auch von ConTeXt wird das Suchen und Ersetzen das die Formatierung implementiert durch einen internen Makroprozessor bewerkstelligt Auch die 1981 von Charles Goldfarb vorgestellte die generische Auszeichnungssprache IBM Generalized Markup Language ubersetzte Makros in die prozedurale troff ahnliche Sprache SCRIPT An den Beispielen sollten auch zwei Vorteile der generischen Auszeichnung gegenuber der prozeduralen erkennbar sein Generisch ausgezeichneter Quellcode beansprucht weniger Speicherplatz als prasentational ausgezeichneter 40 sobald die Zahl der entsprechenden Textelemente eine von der Komplexitat der Ersetzungsregel abhangige Zahl ubersteigt was im Beispiel noch nicht der Fall ist und in einem Texteditor ist bei generischer Auszeichnung der darzustellende eigentliche Text leichter wiederzufinden als bei prozeduraler Auszeichnung er ist intuitiver zu lesen Vgl auch Don t repeat yourself und Abstraktion Informatik Dieser Speicherplatzeffekt wird noch verstarkt wenn die Stildefinitionen anders als im vorigen Beispiel nicht im Kopf der Textquelldatei dem head Element einer HTML Datei oder oberhalb span class k begin span span class nb span document span class nb span in einer LaTeX Quelldatei dort Dokumentenpraambel genannt stehen sondern in separaten Stildateien die von den Textquelldateien eingebunden werden Transklusion Auf Websites die eine Vielzahl separater Dokumente beherbergen welche einheitlich gestaltet werden sind das CSS Dateien mit der Endung css Abschnitt in CSS Im Falle von LaTeX trugen die Stildateien ursprunglich die Endung sty fur style Heute bestimmen auch Dateien mit der Endung cls die von span class k documentclass span eingelesen werden die Darstellungsweise HTML LaTeX lt head gt lt title gt Hallo Welt lt title gt lt link rel stylesheet type text css href style css gt lt head gt lt body gt lt em gt Hallo lt em gt Welt lt em gt Horst lt em gt du lt body gt documentclass abc art begin document emph Hallo Welt emph H orst du end document Die beiden CSS Zeilen von vorher konnten sich nun in der Datei style css befinden die wie folgt aussahe body color blue background color yellow em color red Darstellungsanderung Bearbeiten Im vorigen Beispielpaar kann man nun die Darstellung des ausgezeichneten Textquellcodes andern indem man jeweils den Kopf andert HTML LaTeX lt head gt lt title gt Hallo Welt lt title gt lt style type text css gt em text decoration underline font style normal lt style gt lt head gt lt body gt lt em gt Hallo lt em gt Welt lt em gt Horst lt em gt du lt body gt documentclass article usepackage ulem begin document emph Hallo Welt emph H orst du end document Im Falle von LaTeX wurde hier der Formatierungsstil des fiktiven The ABC Journal durch eine LaTeX Standardklasse ersetzt und Transklusion der Datei ulem sty 41 eingefugt Diese definiert das aus span class k emph span resultierende Token emph so um setzt eine andere Makro Ersetzungsregel in Kraft dass die Betonung durch Understreichen statt Kursivstellung dargestellt wird Der veranderte CSS Code fur das em Element wirkt ebenso Von der Schriftart abgesehen sollte das Ergebnis mit HTML wie LaTeX so aussehen Hallo Welt Horst du Alternativ konnte der CSS Code in style css geandert werden Fur Fachzeitschriftsnummern konnen die von span class k begin span span class nb span document span class nb span und span class k end span span class nb span document span class nb span eingerahmten Teile der von den einzelnen Autoren eingesandten Quelltexte mit der Dokumentenpraambel des Journals zusammengefugt werden so dass sie alle nach Art des Hauses gleichartig formatiert werden Bei XML Dokumenten kann die Darstellung geandert werden indem man eine andere XSL Transformation verwendet Der generisch ausgezeichnete Text des Dokuments muss zur Anderung der Darstellung also uberhaupt nicht geandert werden Darauf wies das World Wide Web Consortium in der Spezifikation von HTML5 als zweiten Nachteil prasentationaler Auszeichnung hin 42 und Goldfarb 43 sprach von Inflexibilitat in Bezug auf Anderungen der Darstellungsweise als zweitem Nachteil prozeduraler Auszeichnung In der Praxis findet aber etwa LaTeX nicht immer die besten Zeilen oder Seitenumbruche so dass die Bearbeiter einer Fachzeitschriftsnummer gelegentlich ein prasentationales span class k pagebreak span o a einfugen mussen Statt o kann man mit LaTeX o verwenden wenn die Dokumentpraambel etwa span class k usepackage span span class na utf8 span span class nb span inputenc span class nb span enthalt Die so eingelesene Datei inputenc sty ist ein Beispiel dafur dass die Endung sty leider nicht mehr ausschliesslich fur Stil steht solche Pakete bieten vielmehr oft Moglichkeiten die Arbeit zu erleichtern meist durch Erweiterung des Befehlssatzes Fazit Worin besteht die Trennung von Inhalt und Darstellung Bearbeiten Im Falle von LaTeX und HTML enthalt der Quellcode des Dokuments zwar Angaben zur Formatierung bei rein deskriptiver generischer Auszeichnung befinden sich die Angaben zur Formatierung jedoch ausschliesslich in einem Kopfteil der Quelldatei im head Element bzw in der Dokumentpraambel Der darzustellende Text mit generischem Markup befindet sich in einem anderen Teil des Quelldokuments body Element bzw span class nb span document span class nb span Umgebung Die Trennung von Struktur und Prasentation o a besteht dann darin dass Quelldokumente zwei Bestandteile haben von denen einer ausschliesslich Formatierungsregeln angibt und der andere ausschliesslich den Dokumenttext mit generischer Auszeichnung enthalt Die Formatierungsregeln mussen sich nicht direkt im Kopfteil befinden der Kopfteil bindet zumeist den grossten Teil der Formatierungsregeln aus anderen Dateien ein Transklusion Im Falle von LaTeX muss die Datei mit den Angaben zur Formatierung die Steuerdatei nicht den gesamten darzustellenden Text enthalten dieser wird oft auch gerade im Fall von Buchern ebenfalls aus anderen generisch ausgezeichneten Dateien eingebunden In anderen Fallen enthalt das Quelldokument uberhaupt keine Angaben zur Formatierung bindet keine Dateien mit Formatierungsregeln ein z B XML XSL Die Trennung von Inhalt und Form bzw zur Abgrenzung von der Formalen Soziologie von Inhalt und Formatierung ist dann noch deutlicher als schon im vorigen Fall dadurch verwirklicht dass der mit logischer Auszeichnung versehene Inhalt sich in anderen Dateien befindet als die Formatierungsregeln Fur die Wahl eines Darstellungsstils ist dann keine Anderung der Dateien erforderlich die den darzustellenden Text Inhalt enthalten Automatische Codeerzeugung und ursprunglicher Quellcode Bearbeiten Es wurde bereits angesprochen dass ausgezeichneter Text der der Darstellung eines Dokuments auf Ausgabegeraten Drucker Bildschirm zugrunde liegt automatisch aus einer anderen Form von ausgezeichnetem Text erzeugt werden kann Soweit die fixe seitenorientierte Darstellungsform noch als in einer Auszeichnungssprache kodiert angesehen kann ist PostScript eine Auszeichnungssprache PDF wird sie praktisch immer durch ein Satzprogramm automatisch aus einer rein physischen ohne semantisch strukturelle Information rein generischen ohne Hinweise auf die Darstellungsweise wie in HTML5 ohne das style Attribut oder physische und semantisch strukturelle Angaben mischenden Auszeichnungssprache wie bei nicht puristischer Verwendung von LaTeX erzeugt Sie kann direkt aus einer rein physisch ausgezeichneten Erscheinungsform des Dokuments erzeugt werden PDF aus XSL FO und eine rein physische nicht seiten orientierte Form kann aus einer rein strukturellen Erscheinungsform XHTML automatisch erzeugt worden sein etwa durch XSL Transformation Wenn das Werk publiziert oder an einen Adressaten verschickt worden ist oder wenn der fur ein Archiv gewunschte Ausdruck vorliegt geraten die zugrunde liegenden Dateien bestimmter Auszeichnungsformate oft in Vergessenheit von manchen Anwendern werden sie auch geloscht Wenn das Dokument aber noch teilweise wiederverwendet werden soll z B fur eine neue uberarbeitete Buchausgabe oder wenn ein vor Jahren gedruckter Artikel auch als HTML online publiziert werden soll ist es gut wenn die ursprungliche teils semantisch strukturelle Auszeichnung der ursprungliche Quellcode immer noch verfugbar ist und nicht aus einem rein darstellenden Format rekonstruiert werden muss z B nicht nummerierte Abschnittsuberschriften und Unterabschnittsuberschriften Den automatisch erzeugten Code schauen sich Verfasser oder Typisten meist nicht an Bei Verwendung von WYSIWYG Editoren beachtet man typischerweise nicht einmal den ursprunglichen Quellcode Ebenso ist es etwa bei LyX einem Frontend fur LaTeX mit dem man semantisch strukturell auszeichnen und die erzeugte Struktur auch am Bildschirm erkennen kann ohne den Quellcode zu sehen In Anbetracht unterschiedlicher Codierungsweisen von Textzeichen Unicode oder konnte man auch sagen dass der ursprungliche Quellcode in einem Hexdump besteht den man sich nicht ansieht der Texteditor prasentiert eine anwenderfreundliche Version davon die hinsichtlich der am Ausgabegerat zu lesenden Zeichen WYSIWYG artig ist HTML war einmal Format in dem der ursprungliche Quellcode von Dokumenten notiert wurde Inzwischen ist es auch ein Zielformat es wird etwa aus Datenbanken die in XML notiert sein konnen durch Skriptsprachen wie JavaScript und PHP oder aus anderen Quellformaten mit Pandoc erzeugt Um einen Text wie einen Wikipedia Artikel auszuzeichnen sind das jedoch keine Alternativen der reine Text wie er aus Browserfenster durch Copy and Paste extrahiert werden kann muss getippt und markiert werden Die lt und gt sind umstandlich zu tippen und werden durch XML Anforderungen noch vermehrt Zum Teil mussen Attributnamen getippt werden was das Verhaltnis von in der Ausgabe anzuzeigenden Zeichen zu furs Markup verwendeten Zeichen verschlechtert LaTeX ist teilweise einfacher zu tippen und leichter zu lesen da es im Fliesstext hauptsachlich Positionsparameter anstelle von Key Value Angaben verwendet Zudem konnen LaTeX Anwender fur in einem Dokument haufig auftretende Zeichenkombinationen wie Tags welche haufig auftreten ist von Dokument zu Dokument verschieden Abkurzungsbefehle einfuhren in der Dokumentenpraambel oder in sty Dateien dank eingebautem Makroprozessor Zur Vereinfachung der Erzeugung von X HTML Dokumenten sind daher noch folgende Moglichkeiten ersonnen worden HTML Editoren mit Autovervollstandigung TeX4ht wandelt die DVI Ausgabe von TeX in HTML oder auch XML um die Website Meta Language Werkzeuge fur Programmierer dabei wird Makroprozessor m4 genutzt vgl LaTeX Content Management Systeme fur Nichtprogrammierer vgl Redaktionssystem das ist allgemeiner insofern als hierbei auch andere Zielformate als X HTML anvisiert werden und schliesst die bereits mehrfach genannten WYSIWYG Editoren ein vereinfachte Auszeichnungssprachen diese werden nachfolgend genauer beschrieben Sie stellen in Wikis das ursprungliche Quellformat dar aus dem hauptsachlich XHTML erzeugt wird daraus kann dann auch in guter Qualitat gedruckt werden PDF etwa via XSL Siehe auch Programmcode Vereinfachte Auszeichnungssprachen Bearbeiten Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen beispielsweise Einzelnachweisen ausgestattet Angaben ohne ausreichenden Beleg konnten demnachst entfernt werden Bitte hilf Wikipedia indem du die Angaben recherchierst und gute Belege einfugst keine Quelle fur den Ausdruck Vereinfachte Auszeichnungssprache lightweight markup language Merkmale Bearbeiten Beitrage in Wikis Blogs und Internetforen werden typischerweise in Webformularfenstern verfasst Die Gestaltungsmoglichkeiten konnen dabei sehr begrenzt sein was einem gepflegten Erscheinungsbild der sich ergebenden Seiten zugutekommen kann Obwohl das Zielformat in dem die Beitrage den Lesern prasentiert werden HTML oder XHTML ist wird HTML Eingabecode im Formular allenfalls begrenzt akzeptiert sonst weggefiltert Das Markup verwendet von den URLs fur Hyperlinks abgesehen oft nur ungewohnliche Kombinationen von Interpunktionszeichen oder jedenfalls Zeichen die keine Buchstaben sind oder wenige HTML Tags werden verkurzt und entsprechende Elemente nicht geschlossen ahnlich wie in SGML etwa Textile Ubersetzung in XHTML Beispieldarstellungh3 Unterabschnitt lt h3 gt Unterabschnitt lt h3 gt Unterabschnitt ahnlich Haml Dadurch stort das Markup den Lesefluss beim Verfassen des Beitrags im Formularfenster minimal Fur die Darstellung der Dokumente wird dieses Markup dann in die dafur erforderliche komplexere Auszeichnungssprache wie HTML oder XHTML serverseitig umgewandelt etwa durch Pandoc oder wie im Falle der Wikipedia durch die MediaWiki Software Markup Beispiele mit zwei vereinfachten Auszeichnungssprachen MediaWiki Wikitext Markdown so oder so ergibt XHTML Darstellungs beispiel span class k span Abschnitt span class k span span class k span Abschnitt span class p lt span span class nt h2 span span class p gt span Abschnitt span class p lt span span class nt h2 span span class p gt span Abschnitt span class k span Punkt 1 span class k span Punkt 2 span class k span Punkt 3 span class k span Punkt 1 span class k span Punkt 2 span class k span Punkt 3 span class k span Punkt 1 span class k span Punkt 2 span class k span Punkt 3 span class p lt span span class nt ul span span class p gt span span class p lt span span class nt li span span class p gt span Punkt 1 span class p lt span span class nt li span span class p gt span span class p lt span span class nt li span span class p gt span Punkt 2 span class p lt span span class nt li span span class p gt span span class p lt span span class nt li span span class p gt span Punkt 3 span class p lt span span class nt li span span class p gt span span class p lt span span class nt ul span span class p gt span Punkt 1 Punkt 2 Punkt 3 span class k span https www w3 org W3C span class k span span class k span W3C span class k span https www w3 org span class k span span class p lt span span class nt a span span class na href span span class o span span class s https www w3 org span span class p gt span W3C span class p lt span span class nt a span span class p gt span W3C span class k span fett span class k span span class k span fett span class k span span class k span fett span class k span span class p lt span span class nt b span span class p gt span fett span class p lt span span class nt b span span class p gt span fett span class k span kursiv span class k span span class k span kursiv span class k span span class k span kursiv span class k span span class p lt span span class nt i span span class p gt span kursiv span class p lt span span class nt i span span class p gt span kursivWeiter verzichten vereinfachte Auszeichnungssprachen typischerweise auf Nutzung einfacher Codezeilenumbruche und des Einruckens von Code allein zu dessen Strukturierung im Sinne der Lesbarkeit und Verstandlichkeit vielmehr beendet etwa im Falle von MediaWiki ein Codezeilenumbruch einen in der Darstellung eingeruckten Absatz hangender Einzug einer Liste oder eines Blockzitats Ein sofort folgendes Sternchen beginnt einen neuen Listenpunkt und wird als typografisches Aufzahlungszeichen dargestellt Nachteil dieser Methode sind mogliche Kollisionen mit einer anderen Funktion der entsprechenden Zeichen die Fehler verursachen konnen In Markdown z B beginnt ein kursiv geschriebener Text mit dem Sternchen ich rufe laut um Hilfe was am Zeilenanfang laut rufe ich um Hilfe mit der Verwendung fur einen Listeneintrag kollidieren kann Eingeruckter Code d h dem Codezeilenumbruch folgt mindestens ein Leerzeichen wird in Wikitext verbatim als Code ohne Syntaxhighlighting dargestellt Weitere und genauere Beispiel bieten die Artikel Wikitext und Markdown sowie die weiteren Artikel in der Kategorie Vereinfachte Auszeichnungssprache Neben rein logischen deskriptiven Auszeichnungen wie Uberschriften und reinen Schriftauszeichnungen wie fett konnen weitere Funktionen erfullt werden Tags zur zusatzlichen Auszeichnung eines Datenbestandes mit zusatzlichen Informationen und zur Kategorisierung Transklusionen um Teile anderer Dokumente durch einen Verweis einzuschliessen Zwar ist das hauptsachliche Zielformat solcher Sprachen HTML oder XHTML jedoch konnen viele von ihnen dank Pandoc in eingeschrankter Weise sogar als Frontend fur LaTeX und ConTeXt verwendet werden und so letztlich PDF als Zielformat haben oder sie konnen so in Textverarbeitungsformate E Books und Dokumentationsformate DocBook Manpages umgewandelt werden Historische Entwicklung Bearbeiten Vereinfachte Auszeichnungssprachen wurden schon immer in rein textbasierten Systemen z B Readme oder E Mails zur Darstellung von Hervorhebungen wie Kursiv oder Fett verwendet ohne dass diese weiter umgewandelt wurden Besonders ist die Syntax von Markdown das mit umgewandelt wird eng an diese historische Praxis angelehnt Die meisten Auszeichnungssprachen haben sich in der Anwendung unterschiedlicher Software gebildet es gibt kaum standardisierte oder einheitliche Losungen obwohl die Funktionen oft ahnlich sind Um in Wikis an Hypertexten zusammenzuarbeiten gibt es unterschiedlichen Wikitext aber auch den Versuch einer Standardisierung mit Creole In Foren hat sich der BBCode etabliert Fur den Emacs gibt es Org mode Zur Einbettung strukturierter Dokumentation in Computerprogramme Plain Old Documentation POD fur Perl oder Javadoc fur Java Markdown Textile AsciiDoc und reStructuredText konzentrieren sich auf jeweils andere Vorgehensweisen Die wohl erste vereinfachte Auszeichnungssprache mit Umwandlung wurde 1994 von Ward Cunninghams entwickelt und 1995 als WikiWikiWeb zusammen mit dem Portland Pattern Repository veroffentlicht siehe auch Chronologie der Hypertext Technologien Daten Bearbeiten YAML und seine Untermenge JavaScript Object Notation JSON sind vereinfachte Auszeichnungssprachen fur die Datenserialisierung Siehe auch Kategorie Vereinfachte AuszeichnungsspracheAussere Systematik Einordnung als Programmiersprache oder Datenformat BearbeitenDateinamenserweiterungen und MIME Typen ausgewahlter Auszeichnungssprachen Auszeichnungssprache Dateiendung MIME TypHTML htm html text htmlPostScript ps application postscriptRich Text Format rtf text rtfTeX LaTeX tex text x texXML xml text xmlZur Frage ob eine Auszeichnungssprache eine Programmiersprache ist oder nicht oder ob eine bestimmte Auszeichnungssprache wie HTML eine Programmiersprache eine HTML Datei ein Programm 44 ist oder nicht 45 finden sich gegensatzliche Ausserungen Zu XML erklarte das W3C 2001 es sei keine Programmiersprache sondern biete Regeln zum Festlegen von Textformaten zur Strukturierung von Daten 46 also zum Festlegen von Datenformaten damit steht es nicht allein 47 Tatsachlich ergab die Entwicklung von SGML zu XML die Moglichkeit Auszeichnungssprachen zu vollig anderen Zwecken als dem ursprunglichen der Formatierung von Texten zu nutzen Beispielsweise wird die Konfiguration des Linux Fenstermanagers Openbox in einer XML Datei abgelegt statt Zeilen der Gestalt i key i i value i wie in den Konfigurationsdateien anderer Programme findet man hier lt i key i gt i value i lt i key i gt vgl anderes Beispiel und ubergeordnete Elemente wie mouse werden zur Gliederung der ungefahr 900 Zeilen umfassenden Datei verwendet Es ist ganz und gar nicht beabsichtigt diese Konfigurationsdatei als Dokument zu setzen Der Artikel XML nennt weitere Beispiele solcher ursprunglich nicht intendierter Anwendungsweisen von XML Als Datenformat ist die in einer Dokument Datei verwendete Auszeichnungssprache an den Dateinamenserweiterungen erkennbar siehe Tabelle Diejenigen Auszeichnungssprachen die noch zum Erstellen von Dokumenten gedacht sind HTML PostScript troff LaTeX RTF bilden Dokumentenformate Binare Dokumentenformate a href Microsoft Word html title Microsoft Word doc a a href Portable Document Format html title Portable Document Format pdf a das Ausgabeformat DVI von TeX sind keine Auszeichnungssprachen Von den Musterbeispielen prozeduraler Auszeichnungssprachen 32 PostScript TeX und dem Nachkommling troff des urzeitlichen RUNOFF auf das auch Goldfarbs GML aufsetzte ist bekannt dass sie Turing vollstandig sind Insofern konnen diese beliebig komplexe Algorithmen darstellen und erfullen so ein wesentliches allgemein anerkanntes Merkmal von Programmiersprachen XSLT bildet eine weitere Turing vollstandige Programmiersprache deren Befehle jedoch wie bei den vorgenannten Sprachen fur die Darstellung mit XML deskriptiv ausgezeichneter Dokumente ausgelegt sind und die kurioserweise selbst in einem XML Datenformat notiert ist 48 Ebenso ist die in XML notierte Sprache XQuery fur XML Datenbanken Turing vollstandig Siehe auch Andere Bedeutungen im Artikel QuelltextLiteratur BearbeitenJames H Coombs Allen H Renear Steven J DeRose Markup Systems and the Future of Scholarly Text Processing In Communications of the ACM Band 30 Nr 11 November 1987 ISSN 0001 0782 S 933 947 doi 10 1145 32206 32209 xml coverpages org fdi ucm es abgerufen am 7 Juli 2015 Robin Cover SGML A Textual Representation for Information Structure In Summer Institute of Linguistics Inc Hrsg Notes on Computing Band 16 September Oktober 1997 sil org Memento vom 22 April 2003 im Internet Archive abgerufen am 27 Juli 2015 Michael Downes TeX and LaTeX 2e In Notices of the AMS Band 49 Nr 11 Dezember 2002 S 1384 1391 ams org PDF 822 kB abgerufen am 26 Juli 2015 Richard Furuta Important papers in the history of document preparation systems basic sources In Electronic Publishing Origination Dissemination amp Design Band 5 Nr 1 John Wiley amp Sons Chichester UK Marz 1992 S 19 44 citeseerx ist psu edu abgerufen am 7 Juli 2015 Relevante Abschnitte 4 5 6 1 6 2 Charles Goldfarb A Generalized Approach to Document Markup In Proceedings of the ACM SIGPLAN SIGOA Symposium on Text Manipulation SIGPLAN Notices Band 16 Nr 6 Juni 1981 S 68 73 citeseerx ist psu edu PDF abgerufen am 9 Juli 2015 Michel Goossens Frank Mittelbach Alexander Samarin Der LaTeX Begleiter 1 Auflage Addison Wesley Bonn u a 1994 ISBN 3 89319 646 3 Abschnitt 1 3 Generisches Markup und 1 4 Die Notwendigkeit des visuellen Markups S 7 10 englisch The LaTeX Companion 1994 Ubersetzt von Claudia Kraft und Rebecca Stiels Motivation von LaTeX durch die Beitrage Goldfarbs und Reids die auch erlautert werden Abschnitt 1 3 3 tragt den Titel Die Trennung von Inhalt und Form Bemerkenswerterweise findet sich davon in der zweiten Ausgabe Mittelbach und Goossens 2004f s u nur noch Bemerkungen zum Verhaltnis von LaTeX zu Reids Scribe S 2 und ein Satz am Anfang des zweiten Kapitels beides in vollig anderer Terminologie Dmitry Kirsanov Chapter 3 SGML and HTML DTD Procedural and Descriptive Markup In Rick Darnell et al Hrsg HTML Unleashed 1 Auflage sams net Indianapolis 1997 ISBN 1 57521 299 4 webreference com Memento vom 30 Juni 2015 im Internet Archive abgerufen am 23 Juli 2015 Frank Mittelbach und Michel Goossens mit Johannes Braams David Carlisle und Chris Rowley sowie Beitragen von Christine Detig und Joachim Schrod The LaTeX Companion Second Edition 4 uberarbeitete Auflage Addison Wesley Boston MA u a 2005 ISBN 0 201 36299 6 Abschnitt 1 1 A brief history S 1 6 A L Oakley A C Norris Page description languages development implementation and standardization In Electronic Publishing Origination Dissemination amp Design Band 1 Nr 2 John Wiley amp Sons Chichester UK September 1988 S 79 96 cs nott ac uk PDF 122 kB abgerufen am 3 August 2015 Auf S 79f werden 8 Definitionen von page description language aus fruheren Veroffentlichungen zitiert und zusammengefasst Der Abschnitt Schemes for the description of printed pages von S 89 bis S 92 beschreibt Beziehungen zwischen Seitenbeschreibungssprachen und anderen Auszeichnungssprachen Eric Steven Raymond The Art of Unix Programming Addison Wesley Professional Boston 2004 ISBN 0 13 142901 9 Kapitel 8 Minilanguages catb org u a zur Turing Vollstandigkeit einzelner Auszeichnungssprachen Kapitelanfangsseite der HTML Version vom 23 September 2003 Weblinks BearbeitenTim Bray On Semantics and Markup 9 April 2003 abgerufen am 6 Oktober 2018 englisch Darstellung von Dokumentauszeichnungsarten in wenigen Zeilen kritisch zu semantisch Anmerkungen Bearbeiten Genauer rahmen die ASCII Apostrophe in MediaWiki Wikitext eigentlich nicht Elemente ein und sie gestatten kein Verschachteln von Elementen dafur erlauben sie uberlappendes Markup Das erste Tripel von Apostrophen in einem Quelltextabsatz erzeugt ein lt b gt das nachste ein lt b gt das dritte wieder ein lt b gt usw Das erste Paar von Apostrophen dem kein weiterer Apostroph folgt erzeugt ein lt i gt das nachste ein lt i gt das nachste wieder ein lt i gt usw Am Ende des Absatzes werden offene Tags automatisch durch schliessende erganzt In HTML3 2 vom 14 Januar 1997 war davon noch nichts zu sehen jedoch war am 17 Dezember 1996 mit CSS1 der Grundstein gelegt worden Im Arbeitsentwurf fur HTML 4 0 vom 8 Juli 1997 wurde dann angekundigt dass prasentationale Elemente und Attribute nach und nach durch Stylesheets ersetzt werden sollten Vgl das Informationspaket l2tabu Das Beispiel ist eine Mischung aus PostScript Ein Programmbeispiel und en PostScript Hello world und wurde mit Ghostscript getestet Einzelnachweise Bearbeiten HTML5 A vocabulary and associated APIs for HTML and XHTML W3C Recommendation 28 October 2014 W3C 28 Oktober 2014 abgerufen am 10 Juni 2015 englisch the core language of the World Wide Web the Hypertext Markup Language HTML Meyers enzyklopadisches Lexikon Mannheim 1971 Band 3 S 188 HTML 4 01 Specification W3C Recommendation 15 2 Fonts 24 Dezember 1999 abgerufen am 8 Juli 2015 englisch HTML5 A vocabulary and associated APIs for HTML and XHTML W3C Recommendation 4 5 3 The strong element Nicht mehr online verfugbar 28 Oktober 2014 archiviert vom Original am 1 August 2015 abgerufen am 6 Oktober 2018 englisch lt strong gt The Strong Importance element In MDN Web Docs Abgerufen am 11 August 2019 englisch Browsers typically render the contents in bold type lt em gt The Emphasis element In MDN Web Docs Abgerufen am 11 August 2019 englisch Typically this element is displayed in italic type LaTeX Fonts Emphasizing text in den Wikibooks englisch Mittelbach und Goossens Literatur S 341ff HTML5 A vocabulary and associated APIs for HTML and XHTML W3C Recommendation 4 5 2 The em element Nicht mehr online verfugbar 28 Oktober 2014 archiviert vom Original am 1 August 2015 abgerufen am 6 Oktober 2018 englisch Dokumenttypdefinition a b HTML5 A vocabulary and associated APIs for HTML and XHTML W3C Recommendation 1 10 1 Presentational markup 28 Oktober 2014 abgerufen am 8 Juli 2015 englisch HTML5 A vocabulary and associated APIs for HTML and XHTML W3C Recommendation 4 5 Text level semantics 28 Oktober 2014 abgerufen am 6 Oktober 2018 a b Markup Technologies 98 Conference Agenda and Schedule Annotated In The CoverPages 11 Januar 1998 abgerufen am 28 Juli 2015 englisch Richard Furuta Important papers in the history of document preparation systems basic sources S 20 a b c d e Richard Furuta Important papers in the history of document preparation systems basic sources Abschnitt 4 1 Goldfarb Literatur a b Coombs Renear und DeRose Literatur a b c d Richard Furuta Important papers in the history of document preparation systems basic sources S 30 a b Tim Bray On Semantics and Markup Taxonomy of Markup In www tbray org 9 April 2003 abgerufen am 28 Juli 2015 englisch Richard Furuta Important papers in the history of document preparation systems basic sources bereits 1992 Abschnitt 4 1 a b c HTML 4 01 Specification W3C Recommendation 15 Alignment font styles and horizontal rules 24 Dezember 1999 abgerufen am 8 Juli 2015 englisch a b c d Robin Cover SGML A Textual Representation for Information Structure Downes Literatur S 1368 Richard Furuta Important papers in the history of document preparation systems basic sources 19 a b HTML 4 01 Specification W3C Recommendation 2 3 5 Style sheets 24 Dezember 1999 abgerufen am 28 Juli 2015 englisch HTML 4 01 Specification W3C Recommendation 2 4 1 Separate structure and presentation 24 Dezember 1999 abgerufen am 28 Juli 2015 englisch a b c d Goldfarb Literatur S 68 Goossens Mittelbach Samarin 1994 sowie Mittelbach und Goossens 2004 S 2 Literatur Mittelbach und Goossens Literatur S 2 Mittelbach und Goossens 2004 Literatur S 2 4 Donald E Knuth The TeXbook Illustrations by Duane Bibby Addison Wesley Reading MA u a 1986 ISBN 0 201 13447 0 S 267 ff Broschur ISBN 0 201 13448 9 Neben Makros gibt es weitere Expansionskonstrukte wie Konditionale und Auslesen von Registerinhalten siehe Kapitel 20 a b c Tim Bray On Semantics and Markup Procedural Markup 9 April 2003 abgerufen am 28 Juli 2015 englisch Learn Postscript gsave grestore In wordpress com 19 September 2007 abgerufen am 30 Juli 2015 englisch Miniprogramm als Beispiel David Maxwell Postscript Graphics State Commands gsave Nicht mehr online verfugbar In UBC Math Computing Lab Documentation University of British Columbia archiviert vom Original am 8 November 2015 abgerufen am 30 Juli 2015 englisch Goldfarb Literatur S 69 Goossens Mittelbach Samarin 1994 Literatur S 8 Richard Furuta Important papers in the history of document preparation systems basic sources S 25 Richard Furuta Important papers in the history of document preparation systems basic sources Abschnitt 6 2 Page description languages Zitat Page description languages describe the positioning of graphical marks on a printed page Oakley Norris Literatur S 91f HTML5 A vocabulary and associated APIs for HTML and XHTML W3C Recommendation 1 10 1 Presentational markup 28 Oktober 2014 abgerufen am 12 August 2015 englisch Presentational markup tends to be much more redundant and thus results in larger document sizes Datei ulem sty Abgerufen am 17 Juli 2018 HTML5 A vocabulary and associated APIs for HTML and XHTML W3C Recommendation 1 10 1 Presentational markup 28 Oktober 2014 abgerufen am 12 August 2015 englisch It is significantly easier to maintain a site written in such a way that the markup is style independent For example changing the color of a site that uses lt font color gt throughout requires changes across the entire site whereas a similar change to a site based on CSS can be done by changing a single file Goldfarb Literatur S 68 f Dmitry Kirsanov Literatur HTML Unleashed SGML and the HTML DTD Introduction Nicht mehr online verfugbar 16 Juni 1997 archiviert vom Original am 30 Juni 2015 abgerufen am 6 Oktober 2018 SGML think of it as a programming language to build working programs HTML being one of them Jukka Korpela Technische Universitat Tampere Programs vs markup or why HTML authoring is not programming Nicht mehr online verfugbar 16 November 2015 archiviert vom Original am 22 Januar 2011 abgerufen am 13 Juli 2014 englisch nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot www cs tut fi XML in 10 points Nicht mehr online verfugbar W3C 22 September 2014 archiviert vom Original am 20 Dezember 2016 abgerufen am 6 Oktober 2018 englisch Note This document is no longer maintained but is left for historical purposes Christoph Prevezanos Technisches Schreiben Fur Informatiker Akademiker Techniker und den Berufsalltag Abschnitt 2 1 5 XML Umgebungen Carl Hanser Munchen 2013 ISBN 978 3 446 43721 0 S 13 eingeschrankte Vorschau in der Google Buchsuche abgerufen am 16 Juli 2015 E Book ISBN 978 3 446 43759 3 Zitat XML ist keine Textverarbeitung keine Programmiersprache und auch kein konkretes Programm Stattdessen handelt es sich um eine Auszeichnungssprache mit der sich Texte strukturieren und die Elemente deklarieren lassen Stephan Kepser Universitat Tubingen SFB 441 A Simple Proof for the Turing Completeness of XSLT and XQuery In Extreme Markup Languages 2004 Montreal Quebec Proceedings of Extreme Markup Languages 2004 HTML Fassung des Vortragtexts abgerufen am 19 Juli 2015 HTML Fassung des Vortragtexts Memento des Originals vom 4 Mai 2012 im Internet Archive nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot conferences idealliance org Abgerufen von https de wikipedia org w index php title Auszeichnungssprache amp oldid 231722256