www.wikidata.de-de.nina.az
Dieser Artikel erlautert den Begriff der Informatik zur Typographie siehe Leerzeichen und Typografischer Weissraum Leerraum fachsprachlich auch englisch Whitespace waɪtspeɪs Weissraum oder Zwischenraumzeichen ist in der Informatik eine Bezeichnung fur Zeichen in einem Text die im Texteditor oder Textverarbeitungsprogramm normalerweise nur durch Leerflachen dargestellt werden und dennoch Speicher Platz in Anspruch nehmen Sie dienen vorrangig fur Wortabstande Leerzeichen Zifferngruppierung Umbruchverhinderung und ermoglichung unterschiedlich breite schmale Leerzeichen Je nach Kontext werden verschiedene Zeichen als Leerraum angesehen fast immer zumindest Leerzeichen und Tabulatorzeichen meist auch Zeilenumbruche Viele Programme bieten auch die Moglichkeit diese Zeichen durch stellvertretende Formatierungsymbole zum Beispiel fur Zeilenumbruche fur Leerzeichen und oder gt fur Tabulatorzeichen sicht und unterscheidbar zu machen In der Programmierung kommt diesen Zeichen einerseits eine besondere Rolle zu In verschiedenen Programmiersprachen konnen sie einzelne geschutzte Worter und ebenso Namen von Variablen voneinander trennen Manche Programmiersprachen etwa Python verlangen eine spezielle Formatierung des Quellcodes durch Whitespace Zeichen Einruckung von Blocken Andererseits ist es aber abhangig von der Syntax der Programmiersprache oftmals belanglos ob eines oder mehrere dieser Zeichen aufeinander folgen Deshalb bieten insbesondere Vergleichsprogramme oder Vergleichs Funktionen in IDE eine Option Ignore Whitespace an Bei der Zahlung der Zeichen eines Textdokumentes wird der Leerraum manchmal nicht mitgezahlt Regulare Ausdrucke BearbeitenFur regulare Ausdrucke sind zwei leicht abweichende Definitionen fur die in der Zeichenklasse s bzw space als Leerraum angesehenen Zeichen verbreitet In Perl kompatiblen regularen Ausdrucken PCRE zahlen mindestens das Leerzeichen U 0020 das Horizontal Tabulatorzeichen U 0009 der Zeilen U 000A und Seitenvorschub U 000C sowie der Wagenrucklauf U 000D zum Leerraum 1 In regularen Ausdrucken nach POSIX Standard zahlt zusatzlich das Vertikal Tabulatorzeichen U 000B zum Leerraum 2 In beiden Fallen kommen je nach eingestelltem Locale evtl weitere Zeichen dazu im Japanischen beispielsweise das ideographische Leerzeichen U 3000 3 Der ECMA Standard und damit auch JavaScript trifft eine eigene Festlegung fur die als Leerraum angesehenen Zeichen in regularen Ausdrucken Sie schliesst unter anderem das geschutzte Leerzeichen U 00A0 die Byte Order Mark U FEFF und alle im Unicode Standard Version 3 0 als Leerraum definierten Zeichen ein 4 Unicode BearbeitenIn Unicode sind jedem Codepoint das heisst jedem Unicode Zeichen mehrere Unicode Eigenschaften zugeordnet Unter anderem sind die Zeichen in allgemeine Kategorien General Category gc unterteilt Die als Leerraum angesehenen Zeichen sind hier in der Kategorie fur Steuerzeichen Cc sowie den drei Kategorien fur Zeilen Absatz und sonstige Trenner Zl Zp und Zs enthalten Eine Kategorie fur Leerraum existiert nicht Daneben wird jedes Zeichen einer Bidirektionalitats Klasse Bidi Class bc zugeordnet Hier existiert eine Klasse mit dem Namen White Space WS fur die Verwendung innerhalb des Unicode Bidi Algorithmus die allerdings nur verschiedene Leerzeichen beinhaltet Zeichen wie Tabulatorzeichen und Zeilenvorschube zahlen hier nicht als Leerraum sondern sind eigenen Bidirektionalitats Klassen fur allgemeine Separatoren CS Segment S und Absatztrenner B zugeordnet Zum Leerraum werden 25 Zeichen gezahlt die mit der Eigenschaft White Space gekennzeichnet sind 5 Mehrere Steuerzeichen im Einzelnen das Horizontal U 0009 und Vertikal Tabulatorzeichen U 000B der Zeilen U 000A und Seitenvorschub U 000C sowie der Wagenrucklauf U 000D Das Leerzeichen U 0020 Das Steuerzeichen fur die nachste Zeile U 0085 Das geschutzte Leerzeichen U 00A0 Das Ogham Leerzeichen U 1680 Elf schmale Leerzeichen Haarspatium und Geviert Leerzeichen in verschiedenen Grossen U 2000 bis U 200A Zeilen und Absatztrenner U 2028 und U 2029 Das schmale geschutzte Leerzeichen U 202F Das mittlere mathematische Leerzeichen U 205F Das ideographische Leerzeichen U 3000 Fur die Verwendung in der Softwareentwicklung und insbesondere in Programmiersprachen definiert Unicode eine zweite Eigenschaft namens Pattern White Space wortlich Muster Leerraum nach den Mustern in regularen Ausdrucken mit nur 11 Zeichen U 0009 bis U 000D U 0020 U 0085 U 200E U 200F U 2028 und U 2029 Hier fehlen insbesondere die geschutzten und sprachspezifischen Leerzeichen Auch diese Aufzahlung gilt nur als Empfehlung und kann von den Entwicklern der Programmiersprache abgeandert werden wobei empfohlen wird den Unicode Standard als Grundlage fur die abweichende Definition zu verwenden 6 In Situationen in denen die Gegenwart eines Leerzeichens oder sogar mehrerer aufeinanderfolgender Leerzeichen explizit dargestellt werden soll werden gelegentlich Leerzeichen durch das Leerzeichensymbol als Platzhalter ersetzt Unicode definiert dafur das Zeichen U 2423 Open box offener Kasten siehe Unicodeblock Symbole fur Steuerzeichen In HTML5 und XML ist dafur die Entitat amp blank definiert 7 8 Einzelnachweise Bearbeiten Perl Programming Documentation Using character classes 2000 The Open Group Base Specifications Locale Definition 2004 The Open Group Locales Memento des Originals vom 29 September 2008 imInternet Archive nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot www opengroup org 2010 ECMAScript Language Specification ECMA 262 Edition 5 1 Juni 2011 Unicode Haufig gestellte Fragen Darin All the characters that have the White Space property also generically known as whitespace characters Unicode Unicode Standard Annex 31 Identifier and Pattern Syntax Darin Each programming language can define its own whitespace characters relative to the Unicode Pattern White Space characters with some specified set of additions or subtractions HTML 5 A vocabulary and associated APIs for HTML and XHTML 8 5 Named character references W3C 28 Oktober 2014 abgerufen am 16 April 2021 XML Entity Definitions for Characters 2nd Edition 2 2 Legacy Entity sets ISOPUB W3C 10 April 2014 abgerufen am 16 April 2021 Schriftsysteme in Unicode Lateinisch Griechisch und Koptisch Kyrillisch und Glagolitisch Hebraisch Arabisch und Syrisch Indische Schriften Ostasiatische Schriften Historische SchriftenInterpunktionszeichen Zahlzeichen Symbole Mathematische Zeichen Leerraum Steuerzeichen Abgerufen von https de wikipedia org w index php title Leerraum amp oldid 228734050