www.wikidata.de-de.nina.az
Texte Worter und Zeichen werden in Computern durch Zahlen reprasentiert daher ist es notwendig eine Zuordnung von Zahlen und Zeichen herzustellen Diese Zuordnung wird durch eine Zeichensatztabelle definiert die den darstellbaren Zeichen und Steuerzeichen Zahlenwerte zuordnet Alternative Begriffe fur Zeichensatztabelle sind Codepage oder Character Map Inhaltsverzeichnis 1 Geschichte 2 Beispiele 2 1 IBM PC OEM Zeichensatztabellen 2 2 DBCS MBCS 3 Wichtige Zeichensatztabellen 4 Siehe auch 5 WeblinksGeschichte BearbeitenHistorische Zeichensatztabellen unterliegen haufig einer Beschrankung auf 256 Zeichen was wiederum bedingt dass eine Zeichensatztabelle mit 256 Zeichen neben dem lateinischen Alphabet meist nur ein weiteres Alphabet speichern kann Die Verwendung dieser fruhen einfachen Zeichensatztabellen fuhrte aber zu Problemen In manchen Zeichensatztabellen sind nicht alle Zeichen ausreichend dokumentiert oder bestimmte Eintrage der Zeichensatztabelle werden unterschiedlich genutzt Ferner kann ein Text haufig nur eine Zeichensatztabelle benutzen wodurch es schwierig wird Zeichen anderer Sprachen in den Text zu integrieren Um diese Probleme zu losen wurde Unicode eingefuhrt Im Gegensatz zu normalen Zeichensatztabellen trennt Unicode zwischen der Zuordnung von Zahlen sog Codepoints zu Zeichen und der Codierung der Zeichen Die verschiedenen Codierungsschemata von Unicode konnen aber ihrerseits wieder als Zeichensatztabellen verstanden werden Wahrend eine Zeichensatztabelle die Zuordnung von Zahlen zu Zeichen definiert speichern Fonts das Aussehen der Zeichen Fur die Darstellung von Text auf Computern sind ublicherweise also sowohl eine Zeichensatztabelle wie auch ein Font notwendig Die Darstellung von Texten oder Dateinamen mit der falschen Zeichensatztabelle fuhrt zur Darstellung falscher Zeichen In deutschen Texten leiden darunter haufig die Umlaute oder das Eszett auch wenn der Text im Wesentlichen lesbar bleibt Texte mit anderen Schriftsystemen werden bei Anzeige mit der falschen Zeichensatztabelle hingegen unlesbar Mojibake Beispiele BearbeitenIBM PC OEM Zeichensatztabellen Bearbeiten Diese Zeichensatztabellen sollten nur zur Kompatibilitat mit bestehenden Dokumenten und System genutzt werden Fur neue Systeme und Texte empfiehlt sich die Verwendung von Unicode DBCS MBCS Bearbeiten Diese Codepages erlauben die Speicherung asiatischer Zeichen bei denen die aus 8 Bit resultierenden 256 Zeichen nicht ausreichen Dazu werden 16 Bit Tupel verwendet DBCS MBCS die bis zu 65536 unterschiedliche Zeichen erlauben Wichtige Zeichensatztabellen BearbeitenFur effiziente Verarbeitung auf Computern werden Zeichensatztabellen durch Zahlen identifiziert Die Nummerierung der Zeichensatztabellen ist allerdings nicht genormt so dass verschiedene Computer oder Betriebssysteme unterschiedliche Zahlen verwenden konnen Codepage Nummer Bedeutung Zeichencodierung437 Die ursprungliche Zeichensatztabelle des IBM PC char 8 Bit 720 Arabisches Alphabet char 8 Bit 737 Griechisches Alphabet char 8 Bit 775 Estnisches Alphabet Litauisches Alphabet und Lettisches Alphabet char 8 Bit 819 Latin 1 entspricht ISO 8859 1 char 8 Bit 850 Multilingual DOS Latin 1 westeuropaische Sprachen char 8 Bit 852 Slawische Sprachen Latin 2 zentraleuropaische und osteuropaische Sprachen char 8 Bit 855 Kyrillisches Alphabet char 8 Bit 857 Turkisches Alphabet char 8 Bit 858 Multilingual mit Eurozeichen char 8 Bit 860 Lateinisches Alphabet mit portugiesischen Sonderzeichen char 8 Bit 861 Islandisches Alphabet char 8 Bit 862 Hebraisches Alphabet char 8 Bit 863 Lateinisches Alphabet mit franzosischen Sonderzeichen char 8 Bit 864 Arabisches Alphabet char 8 Bit 865 Danisch und Norwegisch unterscheidet sich von 437 nur durch O o anstelle von und char 8 Bit 866 Kyrillisches Alphabet char 8 Bit 869 Griechisches Alphabet char 8 Bit 874 Thai Alphabet char 8 Bit 932 Japanische Schreibsysteme DBCS Gemischt 8 und 16 Bit936 GBK fur chinesische Kurzzeichen DBCS Gemischt 8 und 16 Bit949 Hangul Koreanische Schriftzeichen DBCS Gemischt 8 und 16 Bit950 Chinesische Langzeichen DBCS Gemischt 8 und 16 Bit1200 UTF 16 LE little endian Unicode Tupel von 16 Bit Worten1201 UTF 16 BE big endian Unicode Tupel von 16 Bit Worten1250 Zentral und osteuropaische Sprachen char 8 Bit 1251 Kyrillisches Alphabet char 8 Bit 1252 Westeuropaische Sprachen char 8 Bit 1253 Griechisches Alphabet char 8 Bit 1254 Turkisches Alphabet char 8 Bit 1255 Hebraisches Alphabet char 8 Bit 1256 Arabisches Alphabet char 8 Bit 1257 Baltische Sprachen char 8 Bit 1258 Vietnamesische Sprachen char 8 Bit 10000 Macintosh Roman char 8 Bit 10007 Macintosh Kyrillisch char 8 Bit 10029 Macintosh Zentraleuropaische Sprachen char 8 Bit 20127 US ASCII char 7 Bit 28591 ISO 8859 1 char 8 Bit 65000 UTF 7 Unicode Tupel von 8 Bit Worten65001 UTF 8 Unicode Tupel von 8 Bit WortenSiehe auch BearbeitenZeichensatz Lokalisierung Softwareentwicklung Weblinks BearbeitenCharacter Sets Internet Assigned Numbers Authority abgerufen am 6 Marz 2022 englisch offizielle Liste bei der IANA registrierter Zeichensatztabellen Code Page Identifiers Microsoft abgerufen am 6 Marz 2022 englisch Liste der Codepage Nummern von Microsoft Windows Abgerufen von https de wikipedia org w index php title Zeichensatztabelle amp oldid 222146881