www.wikidata.de-de.nina.az
Als ostasiatische Schriftzeichen werden in Unicode eine Reihe von Schriften zusammengefasst die im ostasiatischen Kulturraum entstanden sind und dort verwendet werden Neben der umfangreichsten und altesten Gruppe den chinesischen Schriftzeichen sind dies Schriften die in den Nachbarlandern Chinas verwendet werden und die teilweise von den chinesischen Zeichen beeinflusst sind Die beiden japanischen Silbenschriften Hiragana und Katakana das koreanische Alphabet Hangeul und die Silbenschrift Yi Ausserdem ist auch die chinesische phonetische Silbenschrift Bopomofo in Unicode kodiert Inhaltsverzeichnis 1 Kodierte Zeichen 1 1 Chinesische Schriftzeichen 1 2 Bopomofo 1 3 Hiragana und Katakana 1 4 Hangeul 1 5 Yi 1 6 Weitere Zeichen 2 Darstellung 3 Quellen 4 Einzelnachweise 5 WeblinksKodierte Zeichen BearbeitenChinesische Schriftzeichen Bearbeiten Chinesische Schriftzeichen werden nicht nur fur die chinesische Sprache verwendet Ursprunglich wurde auch das Japanische ausschliesslich mit den Kanji genannten chinesischen Schriftzeichen geschrieben heute sind sie zusammen mit Hiragana und Katakana in Gebrauch Auch das Koreanische verwendete ursprunglich chinesische Schriftzeichen Hanja genannt Im Laufe der Zeit traten dabei in den einzelnen Sprachen Form und Bedeutungsvarianten der einzelnen Schriftzeichen auf Bei der Aufnahme in Unicode musste daher die Frage geklart werden ob die Zeichen fur jede Sprache einzeln kodiert werden sollen oder nur ein einziges Mal fur alle Sprachen zusammen Man entschied sich dafur die Varianten in den unterschiedlichen Sprachen zu einem einzigen Unicode Zeichen zu vereinigen und extrahierte im Verlauf der Han Vereinheitlichung aus verschiedenen nationalen Standards die in Unicode unter der Bezeichnung CJK kodierten chinesischen Schriftzeichen Bei der Reihenfolge in der die Zeichen kodiert sind folgte man im Wesentlichen dem Kangxi Worterbuch Die folgende Tabelle zahlt die Blocke auf die chinesische Schriftzeichen enthalten Die Spalte Zeitraum gibt an wann die Zeichen der zustandigen Arbeitsgruppe zur Kodierung vorgeschlagen wurden Auch in Zukunft werden weitere chinesische Schriftzeichen in Unicode aufgenommen werden wobei man davon ausgeht dass inzwischen mehr als die Halfte aller moglichen Zeichen kodiert ist 1 Block Bereich Ebene Anzahl belegter Codepunkte Zeitraum VerwendungVereinheitlichte CJK Ideogramme 4E00 9FFF 0 20 941 bis 1992 mit spateren Erganzungen haufigVereinheitlichte CJK Ideogramme Erweiterung A 3400 4DBF 0 6 582 1992 1998 seltenVereinheitlichte CJK Ideogramme Erweiterung B 20000 2A6DF 2 42 711 1998 2002 historischVereinheitlichte CJK Ideogramme Erweiterung C 2A700 2B73F 2 4 149 2002 2006 historischVereinheitlichte CJK Ideogramme Erweiterung D 2B740 2B81F 2 222 2006 2009 eher seltenNeben diesen Blocken gibt es mit CJK Ideogramme Kompatibilitat und CJK Ideogramme Kompatibilitat Erganzung zwei Blocke die bis auf zwolf Ausnahmen Kompatibilitatszeichen enthalten die eigentlich mit anderen Zeichen hatten vereinigt werden konnen zur Kompatibilitat mit anderen Standards aber ihren eigenen Codepunkt zugewiesen bekamen Radikale sind in den Blocken Kangxi Radikale und CJK Radikale Erganzung extra kodiert Einzelne Striche aus denen die Schriftzeichen aufgebaut werden sind im Block Unicodeblock CJK Striche kodiert Sie konnen etwa in einem Index fur chinesische Worterbucher verwendet werden nbsp Ein Schriftzeichen das noch nicht in Unicode kodiert ist kann durch eine ideographische Beschreibungssequenz ersetzt werden Der Block Unicodeblock Ideographische Beschreibungszeichen enthalt eine Reihe von Zeichen die es ermoglichen noch nicht kodierte Zeichen anhand ihres Aufbaus zu beschreiben Dazu wird das neue Zeichen in zwei oder drei bekannte Zeichen zerlegt Diesen wird ein ideographisches Beschreibungszeichen vorangestellt das angibt wie diese Schriftzeichen zu kombinieren sind Die nebenstehende Grafik zeigt wie ein noch nicht in den Unicode Standard aufgenommenes Zeichen durch eine solche ideographische Beschreibungssequenz ersetzt werden kann In 書史 gibt das erste Zeichen an dass es sich um ein Zeichen handelt das man vertikal in zwei Halften zerlegen kann die beiden folgenden Zeichen geben an wie diese Halften aussehen Auch fur andere Kombinationen von Schriftzeichen gibt es Beschreibungszeichen Sind die fehlenden Zeichen sehr komplex so ist es auch moglich Beschreibungssequenzen zu verschachteln also eines der verwendeten Grundzeichen selbst wieder durch eine solche Sequenz zu beschreiben Der Unicodeblock Kanbun enthalt einige Zeichen die im Japanischen fur Anmerkungen in chinesischen Texten verwendet werden Bopomofo Bearbeiten Die phonetische Transkriptionsschrift Bopomofo oder Zhuyin wird in den beiden Blocken Bopomofo und Bopomofo erweitert kodiert Es fehlen lediglich die Tonzeichen diese liegen im Block Unicodeblock Spacing Modifier Letters Hiragana und Katakana Bearbeiten Die beiden Hauptblocke fur die japanischen Silbenschriften Hiragana und Katakana der Unicodeblock Hiragana und der Unicodeblock Katakana sind parallel aufgebaut und folgen im Wesentlichen dem Standard JIS X 0208 Weitere japanische Schriftzeichen finden sich in den Blocken Katakana Phonetische Erweiterungen und Kana Erganzung Hangeul Bearbeiten Fur die koreanische Schrift stellt Unicode zum einen einzelne Jamo in den Blocken Hangeul Jamo Hangeul Jamo erweitert A und Hangeul Jamo erweitert B bereit Diese werden dann bei der Anzeige in Silbenblocken zusammengesetzt Fur die wichtigsten dieser Silbenblocke gibt es im Unicodeblock Hangeul Silbenzeichen bereits zusammengesetzte Silbenzeichen Die Reihenfolge der Kodierung ist dabei so gewahlt dass die Zerlegung der Silben in einzelne Jamo und die Umkehrung etwa bei der Normalisierung algorithmisch einfach durchzufuhren sind Zur Kompatibilitat mit dem koreanischen Standard KS X 1001 definiert der Unicodeblock Hangeul Jamo Kompatibilitat ebenfalls einzelne Jamo die sich aber nicht zu Silben verbinden Yi Bearbeiten Die moderne Silbenschrift Yi ist in Unicode in zwei Blocken kodiert Der Unicodeblock Yi Silbenzeichen enthalt die eigentlichen Silbenzeichen der Unicodeblock Yi Radikale die Radikale aus denen die Schrift sich zusammensetzt Wie bei den chinesischen Radikalzeichen sind diese hauptsachlich zur Verwendung in Indizes gedacht Weitere Zeichen Bearbeiten Neben den Schriftzeichen gibt es weitere Zeichen die aus diesen abgeleitet sind oder mit ihnen zusammen verwendet werden Satzzeichen und einige Symbole speziell fur die ostasiatische Schriften finden sich im Block Unicodeblock CJK Symbole und Interpunktion Weitere Symbole die sich aus diesen Schriftzeichen ableiten oder mit ihnen zusammen verwendet werden befinden sich in den Blocken Umschlossene CJK Zeichen und Monate Zusatzliche umschlossene CJK Zeichen und CJK Kompatibilitat Zur Kompatibilitat mit anderen Standards werden in den Blocken Vertikale Formen fur GB 18030 und CJK Kompatibilitatsformen fur CNS 11643 einige Satzzeichen explizit in der Form kodiert die sie im vertikalen Layout annehmen Ebenfalls zur Kompatibilitat mit CNS 11643 kodiert der Unicodeblock Kleine Formvarianten einige Satzzeichen in einer kleinen Variante Ebenfalls zur Kompatibilitat mit alteren Standards gibt es den Unicodeblock Halbbreite und vollbreite Formen Die meisten Zeichenkodierungen fur ostasiatische Schriften verwenden einen Ein Byte Zeichensatz der auf ASCII aufbaut parallel zu einem Mehr Byte Zeichensatz fur die CJK Zeichen Die Anzahl der Bytes korrespondiert dabei mit der Breite der Zeichen Die Ein Byte Zeichen werden nur mit halber Breite dargestellt Viele dieser Zeichensatze kodieren aber alle Zeichen des ASCII Bereiches ein weiteres Mal mit mehreren Bytes als vollbreite Formen umgekehrt wurden einige Zeichen unter anderem Katakana auch in halber Breite in Zeichensatze aufgenommen Unicode stellt daher ebenfalls die doppelt kodierten Zeichen ein weiteres Mal als vollbreites bzw halbbreites Zeichen zur Verfugung Darstellung BearbeitenDie traditionelle Schreibrichtung der ostasiatischen Schriften ist in Spalten von oben nach unten Die Spalten selbst werden meist von rechts nach links angeordnet Die Zeichen haben dabei alle die gleiche Breite und Hohe Allerdings sind inzwischen auch proportionale Schriftarten mit einer Schreibrichtung in Zeilen von links nach rechts gebrauchlich Einige Zeichen haben ein unterschiedliches Aussehen je nachdem ob sie in vertikalem oder horizontalem Text vorkommen dies betrifft insbesondere Satzzeichen aber auch lateinische Buchstaben diese werden im senkrechten Text meist um 90 gedreht dargestellt Bei der Entscheidung welche Zeichen im vertikalen Layout gedreht werden mussen und welche Zeichen in horizontaler Anordnung in einer proportionalen Schriftart gesetzt werden sollen kann die Unicode Eigenschaft East Asian Width verwendet werden aus der abgelesen werden kann ob ein Zeichen breit ist sich also wie etwa ein chinesisches Schriftzeichen verhalt oder ob es schmal ist und wie ein lateinischer Buchstabe behandelt wird Fur das vertikale Layout gibt es Alternativ einen im Unicode Technical Report 50 beschriebenen Algorithmus der auf eine spezielle Eigenschaft beruht die extra fur diesen Algorithmus definiert wurde Diese Eigenschaft kann fur jedes Zeichen einen von vier verschiedenen Werten annehmen U bedeutet dass das Zeichen auch im vertikalen Layout aufrecht dargestellt werden soll R kennzeichnet Zeichen die um 90 im Uhrzeigersinn gedreht werden Daneben gibt es zwei weitere Werte Tu und Tr Fur Zeichen mit diesen Werten gibt es eine spezielle typographische Variante nur wenn es aus irgendeinem Grund nicht moglich ist diese zu verwenden wird der Wert wie U bzw R behandelt Zunachst wird der Text durch den Unicode Segmentierungsalgorithmus fur Grapheme zerlegt das erste Zeichen eines Graphems bestimmt die Orientierung ausser bei Graphemen mit einem umschliessenden kombinierendem Zeichen welche immer aufrecht dargestellt werden Unicode sieht keinen speziellen Mechanismus vor um bei CJK Zeichen die fur die Sprache korrekte Glyphenvariante zu wahlen In den meisten Fallen wird der Leser die korrekte Schriftart als Standardschrift eingestellt haben und selbst wenn die Zeichen etwa bei chinesischen Zitaten in einem japanischen Text nicht in der erwarteten Form angezeigt werden bleiben sie dennoch lesbar Ist die genaue Darstellung dagegen wichtig mussen dem Text geeignete Metainformationen beigefugt werden Eine Moglichkeit hierfur sind die mittlerweile missbilligten Sprach Tags Fur einzelne Zeichen kann auch mit Hilfe eines Variantenselektors eine spezielle Glyphenvariante ausgewahlt werden Daneben besteht die Moglichkeit uber hohere Protokolle wie HTML Informationen zur Sprache oder zur gewunschten Schriftart ubertragen Bopomofo wird haufig als Anmerkung zum in chinesischen Zeichen geschriebenen Text verwendet je nach Schreibrichtung sollten diese Anmerkungen senkrecht neben oder waagerecht uber dem annotierten Text angezeigt werden hier bieten sich Techniken wie Ruby oder die Verwendung von Anmerkungszeichen an Quellen BearbeitenJulie D Allen et al The Unicode Standard Version 6 2 Core Specification The Unicode Consortium Mountain View CA 2012 ISBN 978 1 936213 07 8 online Chapter 12 East Asian Scripts PDF Ken Lunde Unicode Standard Annex 11 East Asian Width online Koji Ishii Unicode Technical Report 50 Unicode Vertical Text Layout online Einzelnachweise Bearbeiten FAQ Chinese and Japanese Abgerufen am 18 Februar 2013 Weblinks BearbeitenThe secret life of Unicode East Asian issues englisch Schriftsysteme in Unicode Lateinisch Griechisch und Koptisch Kyrillisch und Glagolitisch Hebraisch Arabisch und Syrisch Indische Schriften Ostasiatische Schriften Historische SchriftenInterpunktionszeichen Zahlzeichen Symbole Mathematische Zeichen Leerraum Steuerzeichen Abgerufen von https de wikipedia org w index php title Ostasiatische Schriften in Unicode amp oldid 171233081