www.wikidata.de-de.nina.az
Der chinesische Zeichenkodierungsstandard GB18030 ist eine Kodierung samtlicher Unicode Zeichen derzeit 128 172 darunter die aktuell in Unicode 7 0 kodierten 75 963 Han Zeichen das sind chinesische Schriftzeichen und ihre Varianten in Japan Korea und Vietnam Seit dem 1 September 2001 ist er verbindlich fur alle in der Volksrepublik China verkauften Betriebssysteme und Programme es ist der Nachfolgestandard fur die Kodierungen GBK und GB2312 und deckt traditionelle und vereinfachte Zeichen ab Der offizielle Name ist GB18030 2000 und enthalt GB fur Guojia Biaozhun 國家標準 国家标准 was nationaler Standard bedeutet Veroffentlicht wurde der Standard am 17 Marz 2000 ein Update erschien am 21 November 2000 GB18030 kann als das chinesische Aquivalent zu UTF 8 angesehen werden weil es die Codepunkte fur den gesamten Unicodebereich enthalt auch fur heute noch nicht zugewiesene Codepoints Ahnlich wie UTF 8 ist es eine zu ASCII abwartskompatible Kodierung die uber eine Million Codepunkte zusatzlich reprasentiert im 4 Byte Bereich von Unicode Im Unterschied zu UTF 8 jedoch erhalt GB18030 die Kompatibilitat mit GBK und GB2312 ein Teil der Zuordnungstabelle wurde direkt von GBK ubernommen der Rest algorithmisch ermittelt Zusatzlich schliesst GB18030 auch die Zeichen aus dem taiwanischen Big5 ein Die meisten westlichen Computersysteme hatten bereits eine Variante von Unicode standardisiert als GB18030 erschien Die dabei vorgenommene technische Vereinfachung Unicode als fixe Einheiten mit 16 bit Lange UCS 2 zu behandeln konnte nach seinem Erscheinen nicht mehr fortgefuhrt werden Betriebssystemhersteller und Programmierer wurden sozusagen durch eine volksrepublikanische Verfugung gezwungen entweder variable Formate wie UTF 8 oder UTF 16 zu verwenden oder aber grossere Formate fixer Breite wie UCS 4 oder UTF 32 Mit Windows 2000 nahm Microsoft diesen Schritt vor Linux hatte dies bereits vor der Einfuhrung von GB18030 unterstutzt Die GB18030 kodierte Computerschrift SimSun Founder Extended stellte im Jahr 2000 Glyphen also konkrete Zeichendarstellungen fur den gesamten Zeichenvorrat des damaligen Unicode 3 0 zu Bildschirmanzeige und Ausdrucken zur Verfugung d h bereits einschliesslich des Unicodeblocks Vereinheitlichte CJK Ideogramme Erweiterung A sowie im Vorgriff auch einschliesslich der Erweiterung B aus Unicode 3 1 das erst im Marz des Folgejahrs 2001 publiziert wurde Weitere bekannte Zeichensatze mit fruher Unterstutzung der Erweiterung A sind SimSun 18030 und Code2000 Aufbau der Zeichen BearbeitenSequenzen aus einem Byte entsprechen ASCII und reichen von 00hex bis 7Fhex Sequenzen aus 2 Byte entsprechen GB2312 und bestehen aus einem Start Byte aus dem Bereich 81hex FEhex gefolgt von einem Byte aus dem Bereich 40hex FEhex Sequenzen aus 4 Byte bilden die bis hierhin unberucksichtigten Unicode Zeichen ab Das erste und dritte Byte ist aus dem Bereich 81hex FEhex das zweite und vierte Byte aus 30hex 39hex Im Gegensatz zu UTF 8 kann man also bei einem Oktett im Bereich 30hex 7Fhex nicht davon ausgehen dass es fur ein ASCII Zeichen ist sondern dieser Bytewert kann in Abhangigkeit von seiner Position verschiedene Bedeutung haben Code 0 1 2 3 4 5 6 7 8 9 A B C D E F0 NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI1 DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US2 SP amp 3 ASCII oder zweites oder viertes Byte einer 4 Byte langen Sequenz lt gt 4 ASCII oder zweites Byte einer 2 Byte langen Sequenz 5 6 7 DEL8 9 Erstes oder drittes Byte einer 4 Byte langen Sequenz oder erstes oder zweites Byte einer 2 Byte langen Sequenz A B C D E F 0 1 2 3 4 5 6 7 8 9 A B C D E FWeblinks BearbeitenIANA Charset Registration for GB18030 Englische Zusammenfassung von GB 18030 2000 PDF Datei 408 kB Authoritative Konkordanz zwischen GB18030 und Unicode Warnung technische Schwierigkeiten beim Laden im Browser moglich ICU Converter Explorer GB18030 Unicode CJK Unified Ideographs Extension A PDF 6 5 MB Unicode CJK Unified Ideographs Extension B PDF 29 MB GB18030 Support Paket fur Windows 2000 XP einschliesslich Chinesisch Tibetisch Yi Mongolisch und Thailandisch von Microsoft SILs gratis Fonts Editoren und Dokumentation Abgerufen von https de wikipedia org w index php title GB 18030 amp oldid 222146899