www.wikidata.de-de.nina.az
Mit dem Begriff Han Vereinheitlichung englisch Han unification wird in der Informatik die Vereinheitlichung der chinesischen Hanzi japanischen Kanji und koreanischen Hanja CJK seltener auch der vietnamesischen Chữ nom in einem Zeichensatz bezeichnet Der Begriff wird meistens im Zusammenhang mit Unicode und der dort durchgefuhrten Han Vereinheitlichung verwendet Beispiel fur Han Vereinheitlichung das Ideogramm 次 in Kurzzeichen Langzeichen Kanji und Hanja von links nach rechts Die Idee die verschiedenen Han Schriften in einen Zeichensatz zu vereinigen ist nicht neu schon 1980 existierte mit Chinese Character Code for Information Interchange CCCII ein Zeichensatz der Kurzzeichen Langzeichen und Kanji vereinigte Diese Idee wurde auch bei der Entwicklung des Unicode Standards verfolgt Im Februar 1990 wurde eine eigens auf die Han Vereinheitlichung spezialisierte Gruppe das CJK IRG gegrundet Diese Gruppe wurde wenig spater in IRG umbenannt Als China die Entwicklung eines neuen Zeichensatzes GB 13000 bekanntgab einigten sich Unicode und China darauf den Han Zeichensatz gemeinsam zu entwickeln Han Vereinheitlichung in Unicode Bearbeiten nbsp Tabelle als GrafikFur die Han Vereinheitlichung in Unicode ist die Ideographic Rapporteur Group IRG zustandig die alle Kodierungsvorschlage uberpruft und Zeichen die vereinigt werden konnen ausfindig macht Die Vereinheitlichung in Unicode erfolgt nach strengen Regeln Um die Umstellung von alteren Zeichensatzen auf Unicode einfacher zu machen wurde fur die 20 902 Zeichen der ersten Unicode Version die source separation rule benutzt die besagt dass zwei Ideogramme die in einem alteren Zeichensatz unterschieden werden auch in Unicode unterschieden werden Fur spater kodierte CJK Ideogramme wird diese Regel nicht mehr benutzt Wenn Ideogramme von der historischen Bedeutung her nicht verwandt sind werden sie ebenfalls nicht vereinigt Dies trifft z B auf die Zeichen 土 Erde und 士 Krieger zu welche zwar ahnlich aussehen aber vollig verschiedene Bedeutung und Ursprung haben Anschliessend werden die Ideogramme in ihre einzelnen Striche zerlegt Danach werden die Anzahl und die Position der Striche die Struktur die Kodierung in einem alteren Zeichensatz sowie das Radikal der Zeichen bestimmt Wenn alles ubereinstimmt werden die Zeichen vereinigt sonst nicht Meistens werden Zeichen vereinfacht wenn sie nur bei den verschiedenen Schreibstilen der chinesischen Schrift unterschiedlich aussehen So wird beispielsweise das Radikal 辵 als Radikal 辶 in der Druckschrift entweder mit einem oder mit zwei oberen Punkten geschrieben In der Regelschrift und der Handschrift besitzt dieses Zeichen allerdings uberall nur einen Punkt Ahnlich ist es auch bei dem 示 Radikal das zwar in der klassischen Druckschrift Ming noch wie ein 示 geschrieben wird in der Hand und Regelschrift allerdings 礻 geschrieben wird Da nach den Schriftreformen in der Volksrepublik China und Japan versucht wurde die Druckschrift an die Handschrift anzupassen in Korea allerdings gar nicht und in Taiwan begrenzt treten diese Unterschiede auf Die folgende Tabelle zeigt die unterschiedliche Darstellung eines Zeichens pro Zeile fur verschiedene CJK Schriften Chinesisch ohne weitere Angabe fur die Darstellung im Browser chinesische Kurzzeichen wie in der Volksrepublik China Singapur und Malaysia verwendet chinesische Langzeichen wie in der Republik China Taiwan Hongkong und Macau verwendet Japanisch Koreanisch die von den jeweiligen schriftspezifischen Eigenheiten herruhrt Diese konnen von der Strichreihenfolge der Strichzahl oder der Richtung stammen Zur ordentlichen Funktionsweise mussen dabei die entsprechenden Schriften installiert sein und der Browser die entsprechende richtig auswahlen Sollte das nicht der Fall sein kann man sich alternativ die Grafik rechts ansehen Code Chinesisch Allgemein ChinesischKurzzeichen ChinesischLangzeichen Japanisch KoreanischU 4E0E 与 与 与 与 与U 4ECA 今 今 今 今 今U 4EE4 令 令 令 令 令U 514D 免 免 免 免 免U 5165 入 入 入 入 入U 5168 全 全 全 全 全U 5177 具 具 具 具 具U 5203 刃 刃 刃 刃 刃U 5316 化 化 化 化 化U 5340 區 區 區 區 區U 5916 外 外 外 外 外U 60C5 情 情 情 情 情U 624D 才 才 才 才 才U 6B21 次 次 次 次 次U 6D77 海 海 海 海 海U 6F22 漢 漢 漢 漢 漢U 753B 画 画 画 画 画U 76F4 直 直 直 直 直U 771F 真 真 真 真 真U 7A7A 空 空 空 空 空U 7D00 紀 紀 紀 紀 紀U 8349 草 草 草 草 草U 89D2 角 角 角 角 角U 8ACB 請 請 請 請 請U 9053 道 道 道 道 道U 9913 餓 餓 餓 餓 餓U 9AA8 骨 骨 骨 骨 骨Andererseits wurden aber auch einzelnen Zeichenvariante separat in Unicode aufgenommen was beispielhaft in folgender Tabelle dargestellt werden soll Code Chinesisch Allgemein ChinesischKurzzeichen ChinesischLangzeichen Japanisch KoreanischU 9AD8 高 高 高 高 高U 9AD9 髙 髙 髙 髙 髙U 7D05 紅 紅 紅 紅 紅U 7EA2 红 红 红 红 红U 4E1F 丟 丟 丟 丟 丟U 4E22 丢 丢 丢 丢 丢U 4E57 乗 乗 乗 乗 乗U 4E58 乘 乘 乘 乘 乘U 4FA3 侣 侣 侣 侣 侣U 4FB6 侶 侶 侶 侶 侶U 514C 兌 兌 兌 兌 兌U 5151 兑 兑 兑 兑 兑U 5167 內 內 內 內 內U 5185 内 内 内 内 内U 7522 產 產 產 產 產U 7523 産 産 産 産 産U 7A05 稅 稅 稅 稅 稅U 7A0E 税 税 税 税 税U 4E80 亀 亀 亀 亀 亀U 9F9C 龜 龜 龜 龜 龜U 9F9F 龟 龟 龟 龟 龟U 5225 別 別 別 別 別U 522B 别 别 别 别 别U 4E21 両 両 両 両 両U 4E24 两 两 两 两 两U 5169 兩 兩 兩 兩 兩Kritik Bearbeiten nbsp Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen beispielsweise Einzelnachweisen ausgestattet Angaben ohne ausreichenden Beleg konnten demnachst entfernt werden Bitte hilf Wikipedia indem du die Angaben recherchierst und gute Belege einfugst In Ostasien wird die Han Vereinheitlichung hauptsachlich aus kulturellen allerdings auch aus technischen Grunden kritisiert Historisch gab es im Chinesischen wie im Japanischen keine exakte Trennung zwischen Glyphe und Schriftzeichen Beim Design von Unicode hatte das Konsortium die Wahl entweder diese Differenzierung systematisch einzufuhren oder aber vollstandig darauf zu verzichten und jede Variation separat zu kodieren Dies hatte fur zahlreiche semantisch identische Zeichen zu zahlreichen Varianten gefuhrt insbesondere auch zu Varianten die sich nicht eindeutig am Sprachraum klassisches Chinesisch vereinfachtes Chinesisch Japanisch Koreanisch sondern nur historisch abgrenzen lassen Der heutige Unicode Standard stellt einen Kompromiss dar Auf eine vollstandige Vereinheitlichung lediglich nach semantischen Kriterien wurde verzichtet Dies hatte praktische Grunde Es war erklartes Ziel dass sich modernes Chinesisch Japanisch und Koreanisch im selben Text ohne Fontwechsel differenzieren lassen Auch klassische Texte konnen in Unicode 3 1 semantisch eindeutig abgebildet werden Lediglich die Darstellung historischer Variationen die im linguistischen Kontext interessant sein konnen ist in Unicode 3 1 nicht moglich Ein weiteres Problem war die fehlende Moglichkeit in einem Text ohne Markup verschiedene Varianten eines Zeichens anzugeben Besonders im Japanischen wo einige Ortsbezeichnungen und Namen immer noch die alten Radikale benutzen fuhrt das zu Problemen So wird beispielsweise das erste Zeichen des Ortsteils Gion 祇園 von Kyōto nicht mit 礻 geschrieben sondern mit 示 obwohl andere Worter mit 祇 mit dem 礻 Radikal geschrieben werden Unicode 3 2 adressierte dieses Problem mit Variantenselektoren Standardisierte Varianten und historisch verwendete Formen und Zeichen wurden und werden bestandig hinzugefugt so im Unicodeblock Vereinheitlichte CJK Ideogramme Erweiterung A Unicode 3 0 Unicodeblock Vereinheitlichte CJK Ideogramme Erweiterung B Unicode 3 1 Unicodeblock Vereinheitlichte CJK Ideogramme Erweiterung C Unicode 5 2 Unicodeblock Vereinheitlichte CJK Ideogramme Erweiterung D Unicode 6 0 Unicodeblock Vereinheitlichte CJK Ideogramme Erweiterung E Unicode 8 0 sowie Unicodeblock Vereinheitlichte CJK Ideogramme Erweiterung F Unicode 10 0 Weblinks BearbeitenThe Unicode Standard Appendix E Han Unification History aktuelle Version Unicode 15 0 0 13 September 2022 PDF 72 kB englisch The Unicode Standard Chapter 18 East Asia aktuelle Version Unicode 15 0 0 PDF 972 kB englisch The secret life of Unicode Memento vom 25 Juni 2013 im Internet Archive In ibm com archiviert englisch Otfried Cheong Han Unification in Unicode Memento vom 28 Marz 2010 im Internet Archive In tclab kaist ac kr archiviert englisch Abgerufen von https de wikipedia org w index php title Han Vereinheitlichung amp oldid 230897794