www.wikidata.de-de.nina.az
Chinesische Zeichenkodierungen chinesisch 漢字編碼方法 汉字编码方法 Pinyin Hanzi bianmǎ fangfǎ ordnen den chinesischen Schriftzeichen Bytefolgen zur Bearbeitung und Speicherung im Computer zu Alle chinesischen Zeichenkodierungen enthalten auch eine Kodierung der ASCII Zeichen Es gibt wahrscheinlich keine andere Sprache oder Schrift fur die es so viele Kodierungs und Eingabemethoden gibt wie fur das Chinesische Statistiken folgend ubersteigt die Anzahl der Kodierungskonzepte fur die Eingabe chinesischer Schriftzeichen die Zahl Funfhundert Es gibt etwa 40 bis 50 verschiedene Kodes allein fur entworfene Software die formal im Computer getestet wurde Kommerzialisierbar und allgemein gebrauchlich sind jedoch nicht mehr als zehn Dies hat ganz offensichtlich mit der hohen Anzahl an chinesischen Schriftzeichen und der komplizierten Form zu tun gleichzeitig besteht eine direkte Verbindung mit den Tatsachen dass es in China sehr viele Dialekte gibt die Sprache und Schrift in den einzelnen Regionen nicht ubereinstimmt und die allgemeine Hochsprache noch nicht ausreichend verbreitet ist Inhaltsverzeichnis 1 Kodierung und Eingabe 1 1 Liushui Kodierung 1 2 Kodierung nach der Form des Schriftzeichens 1 2 1 Kodierung fur die Gestalt der Striche 1 2 2 Kodierung fur die Wurzel des Schriftzeichens 1 2 3 Kodierung fur Merkmale des Schriftzeichens 1 3 Kodierung nach dem Laut des Schriftzeichens 1 4 Kodierung nach Laut und Form des Schriftzeichens 1 5 Gegenwartige Verwendung 2 Kodierung im Internet 2 1 Big5 2 2 GB2312 2 3 GB18030 2 4 Unicode 2 4 1 Unicode Transformation Formats 2 4 2 SIP 2 4 3 Sonstige Unicode Bereiche 3 Siehe auch 4 WeblinksKodierung und Eingabe BearbeitenDie meisten Kodierungsmethoden fur chinesische Schriftzeichen die mit der Tastatur eingegeben werden lassen sich grob in vier Kategorien einteilen fliessende Kodierung 流水碼 流水码 Liushuǐmǎ Kodierung nach der Form des Schriftzeichens 字形碼 字形码 Zixingmǎ Kodierung nach dem Laut des Schriftzeichens 字音碼 字音码 Ziyinmǎ Kodierung nach Laut und Form des Schriftzeichens 形音碼 形音码 Xingyinmǎ oder 音形碼 音形码 Yinxingmǎ Liushui Kodierung Bearbeiten Auch 無理碼 无理码 wulǐmǎ unvernunftige Kodierung genannt Normalerweise werden arabische Ziffern oder lateinische Buchstaben verwendet um die chinesischen Schriftzeichen zu kodieren zum Beispiel war das Sima dianbao ein verschlusselter Telegrammkode das das Ministerium fur Post und Fernmeldewesen benutzte eine typische Liushui Kodierung Im Prinzip kann man mit den Zahlen von 0001 bis 9999 fast zehntausend Schriftzeichen kodieren Man kann die Kodierung dazu verwenden Telegramme zu schreiben aber das Ministerium fur Post und Fernmeldewesen benutzte es auch als Kodierungsmethode fur die chinesischen Schriftzeichen Der Guojia biaozhun zu Deutsch nationaler Standard Version Informationsaustausch mit der Basissammlung von Zeichen zur Kodierung chinesischer Schriftzeichen GB 2312 80 kodiert 6763 chinesische Schriftzeichen mit den Positionen 1601 bis 8794 aus der Reihenfolge des Liushui Kodes Das ist der unter dem Namen 區位碼 区位码 Quweimǎ Zonenkode bekannte Kode Der Telegrammkode der beiden Zeichen 中国 Zhōngguo zu Deutsch China ist 0022 und 0948 und der Zonenkode ist 5448 und 2590 Kodierung nach der Form des Schriftzeichens Bearbeiten Die Kodierung nach der Gestalt der Zeichen kann in drei Sorten eingeteilt werden Kodierung fur die Gestalt der Striche Kodierung fur die Wurzel des Schriftzeichens Kodierung fur Merkmale des Schriftzeichens Kodierung fur die Gestalt der Striche Bearbeiten Die Kodierung fur die Gestalt der Striche benutzt die grundlegendsten Striche als Eingabe Einheiten Li Jinkais Acht Striche Kodierung ist eine typische Kodierung fur die Gestalt der Striche Er teilt die Striche der chinesischen Schriftzeichen in acht Sorten ein 一 Heng 丨 Shu 丿 Pie 丶 Dian Zhe Wan Cha Fang und kodiert sie mit den Ziffern von eins bis acht Zum Beispiel ist die Kodierung fur die beiden Zeichen 中国 82 und 81714 Die Strichkodierung im Wubizixing Code ist die Methode des zerteilten Zeichens Die Striche 一 Heng 丨 Shu 丿 Pie Na Zhe werden mit den Ziffern von eins bis funf kodiert Kodierung fur die Wurzel des Schriftzeichens Bearbeiten Wird auch Radikal Kodierung oder Struktur Kodierung genannt mit den Radikalen der chinesischen Schriftzeichen als Eingabe Einheiten Wang Yongmins Wubizixing Code ist typisch fur eine Kodierung der Wurzel des Zeichens Er fasste 130 grundlegende Wurzelzeichen zusammen ordnete sie auf der Tastatur an auf jeder Taste sechs Wurzelzeichen eine Taste wird mehrmals verwendet Die Taste L steht z B fur 车 力 甲 田 四 口 Beim Eingeben druckt man die entsprechenden Tasten mit der Buchstabenkombination und schon kann man das benotigte Zeichen eingeben Druckt man zum Beispiel khk und lgyi so werden auf dem Bildschirm die beiden Zeichen 中国 ausgegeben Kodierung fur Merkmale des Schriftzeichens Bearbeiten Es wird gemass der Gesetzmassigkeiten der Konturmerkmale der chinesischen Schriftzeichen kodiert Beispiele 角碼 角码 Jiǎomǎ Eckenkode Es gibt die Drei Ecken Kodierung von Wang An und die Vier Ecken Nummer Kodierung von Wang Yunwu u a Kodierung nach dem Laut des Schriftzeichens Bearbeiten nbsp Tastatur fur doppelte Buchstabierung Die Kodierung nach dem Laut des Schriftzeichens heisst je nach Lautschrift Pinyin in China Zhuyin oder Bopomofo in Taiwan auch Pinyin oder Zhuyin beziehungsweise Bopomofo Eingabe Kodierung Pinyin wird dabei im Zusammenhang mit intelligenten Eingabesystemen fur lateinische Buchstaben verwendet Die Schriftzeichen werden mit ihrer Lautung kodiert Normalerweise kommen die wichtigen Faktoren Anlaut Auslaut und Tone zum Tragen Die Kodierung nach dem Laut der Schriftzeichen kann weiter eingeteilt werden in die Arten komplette Buchstabierung 全拼 quan pin doppelte Buchstabierung 雙拼 双拼 shuang pin und vermischte Buchstabierung 混拼 hun pin Ein Beispiel fur die komplette Buchstabierung von 中国 Zhōngguo ware folgendes Man gibt acht Buchstaben ein Die doppelte Buchstabierung ist vsgo man gibt einen Kode aus vier Buchstaben ein davon stehen v und g jeweils fur die Anlaute zh und g s und o jeweils fur die Auslaute ong und uo Die vermischte Buchstabierung ist jiaty man gibt einen Kode aus funf Buchstaben ein Von den drei oben aufgefuhrten Sorten entspricht nur die komplette Buchstabierung der normierten Schreibung fur die Buchstabierung der chinesischen Schrift Pinyin die doppelte Buchstabierung und die vermischte Buchstabierung sind von den Designern des Kodes entworfen worden Die oben genannten Beispiele doppelte Buchstabierung und vermischte Buchstabierung sind jeweils ein naturlicher Kode und ein spezieller Entwurf fur das CCDOS System Kodierung nach Laut und Form des Schriftzeichens Bearbeiten Diese Kodierungsart ist eine Verbindung aus der Kodierung nach der Form der Schriftzeichen und der Kodierung nach dem Laut der Schriftzeichen Darunter kann man aufteilen in Laut Form Kodierung Form Laut Kodierung Laut Bedeutung Kodierung und andere Gegenwartige Verwendung Bearbeiten Oben wurden vier Moglichkeiten angefuhrt chinesische Schriftzeichen zu kodieren bzw einzugeben Aus der Sicht der gegenwartigen Anwendung favorisieren diejenigen die Chinesisch sprechen konnen und das Pinyin fur Chinesisch verstehen die Pinyin Eingabemethode Diejenigen die Dialekt sprechen benutzen lieber eine Kodierung nach der Form der Schriftzeichen das Wubizixing wird deswegen von den meisten professionellen Tippern beherrscht Kodierung im Internet BearbeitenWenn man seinen Browser beim Laden von chinesischsprachigen Websites richtig einstellen will trifft man meist auf folgende Kodes Big5 Bearbeiten Die Zeichenkodierung Big5 stammt aus Taiwan und wird fur traditionelles Chinesisch verwendet ASCII Zeichen werden in einem Byte kodiert und entsprechen der normalen ASCII Kodierung Chinesische Zeichen werden in zwei Bytes kodiert GB2312 Bearbeiten Die Zeichenkodierung GB2312 wird fur vereinfachtes Chinesisch verwendet ASCII Zeichen werden in einem Byte kodiert und entsprechen der normalen ASCII Kodierung Chinesische Zeichen werden in zwei Bytes kodiert GB18030 Bearbeiten Die Zeichenkodierung GB18030 ist eine Erweiterung von GB2312 auf den Unicodezeichenvorrat und wird fur vereinfachtes Chinesisch verwendet ASCII Zeichen werden in einem Byte kodiert und entsprechen der normalen ASCII Kodierung Chinesische Zeichen werden in zwei oder vier Bytes kodiert In der Fassung GB 18030 2000 sind 110 000 Zeichen definiert Unicode Bearbeiten Unicode unterscheidet sich von den anderen chinesischen Zeichenkodierungen dadurch dass kein Unterschied zwischen vereinfachtem und traditionellem Chinesisch gemacht wird sondern durch die Han Vereinheitlichung alle chinesischen japanischen und koreanischen Zeichen so weit wie moglich identifiziert werden Unicode Transformation Formats Bearbeiten Unicode ordnet den Zeichen zuerst abstrakte Nummern code points zu deren Umsetzung in Bytefolgen in den Unicode Transformation Formats definiert wird In UTF 8 werden ASCII Zeichen in einem Byte kodiert und chinesische Zeichen in drei oder vier Bytes In UTF 16 werden ASCII Zeichen in zwei Bytes kodiert und chinesische Zeichen in zwei oder vier Bytes In UTF 32 werden ausnahmslos alle Zeichen in vier Bytes kodiert Diese Unicode Transformation Formats heissen auch encoding womit die Lange der Speichervariablen 1 2 4 Byte bezeichnet wird und endianness womit die Bytereihenfolge definiert wird big endian little endian SIP Bearbeiten Fur eine grosse Anzahl von wenig benutzten Zeichen werden die Kodes in der Supplementary Ideographic Plane alloziert d h im Bereich U 20000 U 2FFFF Sonstige Unicode Bereiche Bearbeiten Unicode hat auch Bereiche fur Bopomofo Radikale und Sonderzeichen die fur die Typographie gebraucht werden Die lateinischen Zeichen mit Angabe des Tons wie sie fur Pinyin gebraucht werden sind entweder einzeln kodiert oder uber den Bereich fur kombinierende diakritische Zeichen darstellbar Siehe auch BearbeitenCJK Chinesisch Japanisch KoreanischWeblinks BearbeitenGB18030 Zusammenfassung PDF englisch Eingabesysteme unter UNIX Linux BSD usw OXIM SCIM SKIM XCIN Anleitung zu Scim Abgerufen von https de wikipedia org w index php title Chinesische Zeichenkodierung amp oldid 228934783