www.wikidata.de-de.nina.az
Kombinierende Zeichen englisch combining characters marks sind in der digitalen Typografie besondere Zeichen die normalerweise nicht einzeln dargestellt werden sondern mit dem vorhergehenden Zeichen zu einem einzigen Zeichen verbunden werden Dies wird vor allem benutzt um beliebige diakritische Zeichen zu bilden So ergibt beispielsweise der Kleinbuchstabe y gefolgt vom Zeichen Kombinierende Breve ein y ein Zeichen was sich ohne kombinierende Zeichen nicht in Unicode darstellen liesse Vom Konzept her lassen sich also die kombinierenden Zeichen mit den Tottasten auf der Tastatur vergleichen y mit Breve Inhaltsverzeichnis 1 Formale Grundlagen 2 Darstellung 3 Mehrdeutige Darstellungen 4 Kodierte Zeichen in Unicode 5 Literatur 6 Weblinks 7 EinzelnachweiseFormale Grundlagen BearbeitenUmfang und Verwendung kombinierender Zeichen unterscheiden sich zwischen verschiedenen Zeichenkodierungen So kennt ISO 6937 eine Reihe kombinierender Zeichen fur diakritische Zeichen erlaubt aber nur bestimmte Kombinationen Fur eine vollstandige Darstellung reicht es daher aus wenn der verwendete Font eigene Glyphen fur diese Kombinationen bereitstellt Alternativ kann die Kodierung auch aufgefasst werden als eine Kodierung bei der einfache Buchstaben durch einen Codepunkt Buchstaben mit diakritischen Zeichen dagegen durch eine Folge von zwei Codepunkten reprasentiert werden In dieser Norm werden die kombinierenden Zeichen abweichend vom sonst ublichen Verhalten dem Buchstaben vorangestellt mit dem sie kombiniert werden Kombinierende Zeichen werden nicht nur fur diakritische Zeichen eingesetzt so verwenden die Kodierungen aus ISCII 1988 fur verschiedene indische Schriften kombinierende Zeichen auch fur Vokalzeichen Die umfangreichste Sammlung an kombinierenden Zeichen bietet Unicode zusammen mit einer Reihe von Regeln fur deren Darstellung Unicode erlaubt dabei beliebige Kombinationen aus Grundzeichen und kombinierenden Zeichen es durfen auch mehrere kombinierende Zeichen auf ein Grundzeichen folgen Fur die Darstellung reicht es daher nicht aus wenn der Font einige Zusatzglyphen enthalt vielmehr sind Angaben uber die Abmessungen der einzelnen Zeichen notwendig um das Grundzeichen mit dem kombinierenden Zeichen zusammenzusetzen Dies wird etwa vom OpenType Konzept realisiert Im Unicodestandard sind kombinierende Zeichen durch ihre Zeichenklasse General Category M gekennzeichnet Diese wiederum teilt sich in drei Unterklassen auf Nonspacing Mark Mn fur kombinierende Zeichen die in der Regel keinen eigenen Platz benotigen etwa diakritische Zeichen Enclosing Mark Me fur kombinierende Zeichen die das Grundzeichen ganz umschliessen und Spacing Combining Mark Mc fur kombinierende Zeichen die eigenen Platz brauchen etwa indische Vokalzeichen Ferner wird jedem Zeichen eine Eigenschaft Combining Class zugewiesen Dies ist eine ganze Zahl zwischen 0 und 255 die im Wesentlichen die Position angibt an der das kombinierende Zeichen an das Grundzeichen angefugt wird So haben etwa alle kombinierenden Zeichen die uber das Grundzeichen gesetzt werden den Wert 230 Zeichen die unter dem Grundzeichen stehen den Wert 220 Bei normalen nichtkombinierenden Zeichen ist der Wert immer 0 es gibt aber auch einige kombinierende Zeichen mit diesem Wert Darstellung BearbeitenDer Unicodestandard macht nur wenige verbindliche Aussagen daruber wie Programme Zeichenfolgen mit kombinierenden Zeichen darstellen sollen 1 Es werden jedoch die folgenden Empfehlungen angefuhrt nbsp Ein griechisches Alpha mit Spiritus lenis und GravisFolgen auf ein Grundzeichen mehrere kombinierende Zeichen so sollen diese der Reihe nach von innen nach aussen angefugt werden So ergibt etwa die Folge lt Lateinischer Kleinbuchstabe a U 0061 Kombinierender Zirkumflex U 0302 Kombinierende Tilde U 0303 gt ein a bei dem sich uber dem Zirkumflex noch eine Tilde befindet ẫ wahrend bei lt Lateinischer Kleinbuchstabe a U 0061 Kombinierende Tilde U 0303 Kombinierender Zirkumflex U 0302 gt umgekehrt der Zirkumflex uber der Tilde steht a Eine wichtige Ausnahme von diesem Prinzip sind etwa Akzente im Griechischen In der Folge lt Griechischer Kleinbuchstabe alpha U 03B1 Kombinierendes Uberkomma U 0313 Kombinierender Gravis U 0300 gt sollte der Gravis nicht uber dem Komma stehen sondern dahinter ἂ Auch mit dem speziellen kombinierendem Zeichen Combining Grapheme Joiner kann eine Abweichung von der ublichen Stapelung erzwungen werden Falls mehrere kombinierende Zeichen aufeinander folgen die an verschiedenen Stellen an das Grundzeichen angefugt werden etwa oben und unten genauer gesagt richtet sich dies nach der Combining Class Eigenschaft so darf die Reihenfolge keine Rolle spielen das Resultat muss in beiden Fallen gleich aussehen So ergeben lt Lateinischer Kleinbuchstabe a U 0061 Kombinierender Uberpunkt U 0307 Kombinierender Unterpunktakzent U 0323 gt und lt Lateinischer Kleinbuchstabe a U 0061 Kombinierender Unterpunktakzent U 0323 Kombinierender Uberpunkt U 0307 gt beide ein a mit einem Punkt oben und einem unten ạ Falls die typographische Tradition das diakritische Zeichen an eine andere Stelle setzt so ist dies moglich So wird ublicherweise ein Komma unter einem g als ein invertiertes Komma uber dem g dargestellt Die Punkte von i j und einigen weiteren Zeichen mit der Soft Dotted Eigenschaft 2 werden entfernt Im Idealfall orientiert sich ein Programm bei der Positionierung kombinierender Zeichen am genauen Aussehen der Grundbuchstaben so wird ein Akzent uber einem Grossbuchstaben im Normalfall hoher sitzen als bei einem Kleinbuchstaben Der Standard stellt aber klar dass auch eine einfache Positionierung immer an derselben Stelle akzeptabel ist 3 Fur die Darstellung kombinierender Zeichen in den indischen Schriften in Unicode gibt es spezielle umfangreiche Regeln In einigen Fallen mochte man diakritische Zeichen die sich uber zwei oder mehr Grundzeichen erstrecken Hierfur gibt es zwei Techniken Zum einen gibt es sogenannte doppelte kombinierende Zeichen die sich nicht nur wie normale kombinierende Zeichen uber das vorhergehende Grundzeichen erstrecken sondern auch uber das auf das doppelte kombinierende Zeichen folgende Zeichen So gibt etwa lt Lateinischer Kleinbuchstabe n U 006E Kombinierende doppelt so breite Tilde U 0360 Lateinischer Kleinbuchstabe g U 0067 gt ein von einer Tilde uberspanntes ng n g Zum anderen gibt es spezielle kombinierende halbe Zeichen Hier folgt die erste Halfte auf das erste Grundzeichen die zweite auf das zweite Somit kann man ng mit Tilde auch darstellen durch lt Lateinischer Kleinbuchstabe n U 006E Kombinierende doppelbreite Tilde linke Halfte U FE22 Lateinischer Kleinbuchstabe g U 0067 Kombinierende doppelbreite Tilde rechte Halfte U FE23 gt auch dies ergibt n g Um ein kombinierendes Zeichen fur sich alleine darzustellen sollte man ihm ein geschutztes Leerzeichen voranstellen Die fruhere Empfehlung ein normales Leerzeichen zu nehmen wurde wegen Problemen bei der Verarbeitung solcher Leerzeichen in XML und in anderen Kontexten wieder verworfen 4 Fur viele diakritische Zeichen gibt es auch im Unicodeblock Spacing Modifier Letters nichtkombinierende Varianten In technischen Dokumentationen werden kombinierende Zeichen oft mit einem gepunkteten Kreis dargestellt an dem veranschaulicht wird an welcher Position das kombinierende Zeichen an das Grundzeichen angefuhrt wird Mehrdeutige Darstellungen BearbeitenDas Konzept der kombinierenden Zeichen fuhrt dazu dass es Zeichen gibt die sich auf mehrere verschiedene Arten durch Zeichen darstellen lassen Dies hat zwei Ursachen nbsp Zwei Verschiedene Darstellungen fur n ein n mit TildeZum einen gibt es fur viele gebrauchliche Kombinationen aus Grundzeichen und diakritischem Zeichen ein eigenes Zeichen So lasst sich ein n darstellen als lt Lateinischer Kleinbuchstabe n U 006E Kombinierende Tilde U 0303 gt aber es existiert auch ein gesondertes Zeichen Lateinischer Kleinbuchstabe n mit Tilde am Codepunkt U 00F1 Zum anderen ergeben Folgen von kombinierenden Zeichen die nicht miteinander interagieren das gleiche Zeichen Insgesamt kann die Anzahl der verschiedenen Darstellungen dadurch sehr gross werden fur ậ das kleine a mit einem Zirkumflex und einem Punkt unten gibt es etwa die folgenden Darstellungsmoglichkeiten lt Lateinischer Kleinbuchstabe a mit Zirkumflex und Punkt unten U 1EAD gt lt Lateinischer Kleinbuchstabe a mit Zirkumflex U 00E2 Kombinierender Unterpunktakzent U 0323 gt lt Lateinischer Kleinbuchstabe a mit Punkt unten U 1EA1 Kombinierender Zirkumflex U 0302 gt lt Lateinischer Kleinbuchstabe a U 0061 Kombinierender Zirkumflex U 0302 Kombinierender Unterpunktakzent U 0323 gt lt Lateinischer Kleinbuchstabe a U 0061 Kombinierender Unterpunktakzent U 0323 Kombinierender Zirkumflex U 0302 gt Um zu einer eindeutigen Darstellung zu gelangen etwa wenn man wissen mochte ob zwei Worter gleich sind gibt es verschiedene Normalisierungen Zu diesem Zweck ist im Standard zu jedem Zeichen angegeben ob es sich in ein Grundzeichen und kombinierende Zeichen zerlegen lasst und falls ja wie Zunachst werden alle Zeichen auf die angegebene Art zerlegt anschliessend Folgen kombinierender Zeichen die nicht miteinander interagieren gemass ihrer Combining Class Eigenschaft sortiert Dies liefert die kanonische Zerlegung NFD Kodierte Zeichen in Unicode BearbeitenMit Stand Unicode 7 0 Juni 2014 definiert der Unicodestandard 1830 kombinierende Zeichen 5 die sich auf mehrere Blocke verteilen Die drei Blocke Kombinierende diakritische Zeichen Kombinierende diakritische Zeichen Erganzung und Kombinierende diakritische Zeichen erweitert enthalten diakritische Zeichen die fur Buchstaben aller Alphabete vorgesehen sind Der Unicodeblock Kombinierende diakritische Zeichen fur Symbole enthalt ebenfalls kombinierende Zeichen diese sind jedoch fur den Gebrauch mit Symbolen vorgesehen So kann man etwa Warnzeichen zusammensetzen lt Gefahrliche elektrische Spannung U 26A1 Kombinierendes umschliessendes Dreieck nach oben U 20E4 gt ergibt Die kombinierenden halben Zeichen befinden sich im Unicodeblock Kombinierende halbe diakritische Zeichen Viele weitere Blocke enthalten ebenfalls kombinierende Zeichen die speziell fur die Verwendung mit den anderen Zeichen dieses Blocks gedacht sind So befinden sich die kombinierenden Zeichen fur Titlo und weitere kyrillische diakritische Zeichen im Block Kyrillisch Literatur BearbeitenJulie D Allen et al The Unicode Standard version 6 0 Unicode Consortium Mountain View 2001 ISBN 978 1 936213 01 6 online Weblinks BearbeitenAlan Wood s Unicode ResourcesEinzelnachweise Bearbeiten Julie D Allen The Unicode Standard version 6 0 3 6 Combination p 83 ff Unicode Properties List Datafile PropList txt Unicode Technical Committee 12 August 2021 abgerufen am 19 Mai 2022 Julie D Allen The Unicode Standard version 6 0 5 13 Rendering Nonspacing Marks p 157 Julie D Allen The Unicode Standard version 6 0 2 11 Combining Characters p 46 DerivedGeneralCategory txt Abgerufen von https de wikipedia org w index php title Kombinierendes Zeichen amp oldid 232160525