www.wikidata.de-de.nina.az
Der Extended Binary Coded Decimal Interchange Code EBCDIC sinngemass erweiterter Austauschcode fur binar kodierte Dezimalziffern ist eine von IBM entwickelte 8 Bit Zeichenkodierung bei der jedoch nicht alle Codeworter verwendet werden Der EBCDIC ist aus dem alteren Binary Coded Decimal Interchange Code BCDIC entstanden der wiederum auf dem 4 Bit Code BCD Binary Coded Decimal basiert EBCDIC wird fast ausschliesslich auf Grossrechnern verwendet Trotz seines Alters wird die Kodierung auch noch in heutigen Systemen genutzt beispielsweise im 2001 veroffentlichten z OS 1 Ahnlich wie das Unicode Transformation Format UTF 8 eine Kodierung von Unicode unter Beibehaltung der Kodierung des ASCII Zeichensatzes darstellt gibt es eine Unicode Kodierung die auf EBCDIC aufbaut Dieses Format heisst UTF EBCDIC Inhaltsverzeichnis 1 Aufbau der Codepage 1 1 Grundstruktur 1 2 Steuerzeichen 2 Varianten 2 1 Ubersicht der EBCDIC Codepages mit Latin 1 Zeichensatz 2 2 EBCDIC 037 2 3 EBCDIC 273 2 4 EBCDIC 500 2 5 EBCDIC 1140 2 6 EBCDIC 1141 2 7 EBCDIC 1148 2 8 EBCDIC Variante EBCDIC DF 03 DRV CCSN EDF03DRV 3 Anekdotisches 4 Weblinks 5 EinzelnachweiseAufbau der Codepage BearbeitenDie EBCDIC Codepage besteht aus 8 Bits also 28 256 moglichen Kombinationen Diese Zahl reicht nicht aus um fur Sprachen mit lateinischem Alphabet die Sonderzeichen darzustellen darum gibt es ahnlich wie beim ASCII Zeichensatz ISO 8859 verschiedene Varianten Grundstruktur Bearbeiten nbsp Lochkarte mit den Zeichen aus dem Zeichensatz 1964 EBCDIC Latin Man sieht dass sich die EBCDIC Codierung der Buchstaben und Ziffern von der Lochkartencodierung ableitet Wie bei ISO 8859 gibt es ein Grundgerust von Zeichen die in allen Codepages gleich sind Dies sind insbesondere die Buchstaben a z und A Z sowie die Ziffern Hinzu kommen die ersten 64 Zeichen 00hex 3Fhex die Steuerzeichen sind Erkennbar ist der historische Zusammenhang mit der 80 Zeichen Lochkartenkodierung von IBM bei der die Buchstaben A I J R und S Z die Positionen 1 bis 9 bzw 2 bis 9 in der numerischen Zone benutzen Aus dieser historisch gewachsenen Struktur ergeben sich einige Schwierigkeiten Die Buchstaben A Z und a z folgen nicht luckenlos aufeinander Dies erschwert in der Programmierung die Identifikation von Zeichen um zu prufen ob ein Zeichen c ein Grossbuchstabe ist reicht nicht die Prufung A c Z sowie deren Sortierung Im Gegensatz zu ASCII stehen in EBCDIC die Kleinbuchstaben vor den Grossbuchstaben Wichtige Zeichen die in modernen Programmiersprachen benotigt werden fehlen Zum Beispiel und Wahrend in den ASCII Codepages der Bereich der ersten 7 Bits 00hex 7Fhex und nur dieser fur alle Varianten gleich ist ist fur EBCDIC der gemeinsame Bereich unregelmassig uber die 256 Zeichen verstreut gemeinsame Zeichen in allen Varianten 0 1 2 3 4 5 6 7 8 9 A B C D E F4 SP lt 4 4hex 0100bin 5 amp 5 5hex 0101bin 6 gt 6 6hex 0110bin 7 7 7hex 0111bin 8 a b c d e f g h i 8 8hex 1000bin 9 j k l m n o p q r 9 9hex 1001bin A s t u v w x y z A Ahex 1010bin B B Bhex 1011bin C A B C D E F G H I C Chex 1100bin D J K L M N O P Q R D Dhex 1101bin E S T U V W X Y Z E Ehex 1110bin F 0 1 2 3 4 5 6 7 8 9 EO F Fhex 1111bin 0 1 2 3 4 5 6 7 8 9 A B C D E FSP 40hex Leerzeichen EO FFhex spezielles SteuerzeichenSteuerzeichen Bearbeiten Die ersten 64 Zeichen von 00hex bis 3Fhex definieren Steuerzeichen und sind fur alle EBCDIC Codepages identisch 2 Steuerzeichen 0 1 2 3 4 5 6 7 8 9 A B C D E F0 NUL SOH STX ETX SEL HT RNL DEL GE SPS RPT VT FF CR SO SI 0 0hex 00002 1 DLE DC1 DC2 DC3 RESENP NL BS POC CAN EM UBS CU1 IFS IGS IRS IUSITB 1 1hex 00012 2 DS SOS FS WUS BYPINP LF ETB ESC SA SFE SMSW CSP MFA ENQ ACK BEL 2 2hex 00102 3 SYN IR PP TRN NBS EOT SBS IT RFF CU3 DC4 NAK SUB 3 3hex 00112 0 1 2 3 4 5 6 7 8 9 A B C D E FEinige Steuerzeichen haben ihre Bedeutung seit den fruhen Versionen von EBCDIC geandert 04hex war in der ersten EBCDIC Version von 1964 mit einem Zeichen namens PF Punch Off Lochung aus belegt 3 spater wurde daraus ST String Terminator Ende der Zeichenkette 3 und heute 2007 ist es mit SEL Select auswahlen belegt 2 fur das im ASCII Code keine Entsprechung existiert 06hex ist heute 2007 mit RNL Required New Line benotigt neue Zeile belegt Ursprunglich war es mit LC Lower Case Kleinbuchstaben belegt und zwischenzeitlich auch mit SSA System Status Available Systemstatus verfugbar 08hex ist heute mit GE Graphic Escape Umschalten in den Grafikmodus belegt Ursprunglich war es mit EPA End of Protected Area Ende des geschutzten Bereichs belegt 09hex ist heute mit SPS Superscript Hochstellung belegt Ursprunglich war es mit RLF Reverse Line Feed umgekehrter Zeilenvorschub belegt 0Ahex ist heute mit RPT Repeat Wiederholen belegt Ursprunglich war es mit SMM Start of Manual Message Beginn einer handischen Mitteilung belegt 13hex ist heute mit DC3 Device Control 3 Geratekontrollkode 3 belegt Ursprunglich war es mit TM Top Margin oberer Rand belegt 14hex ist heute mit RES ENP Restore Enable Presentation Darstellung wiederherstellen aktivieren belegt Zwischenzeitlich war es auch OSC fur Operating System Command Betriebssystembefehl belegt 17hex ist heute mit POC Program Operator Communication Kommunikation mit Programmbediener belegt Ursprunglich war es IL Idle Leerlauf und zwischenzeitlich auch mit ESA End Selected Area Ende des ausgewahlten Bereichs belegt 1Ahex ist heute mit UBS Unit backspace eine Einheit zuruck belegt Ursprunglich war es mit CC Cursor Control Steuerung der Schreibmarke belegt Die Abkurzung CU1 steht fur Customer Use also ein frei nutzbares Steuerzeichen Die Steuerzeichen IFS Interchange File Separator IGS Interchange Group Separator IRS Interchange Record Separator und IUS Interchange Unit Separator sind Trennzeichen die den ASCII Steuerzeichen FS GS RS und US entsprechen ITB Intermediate Transmission Block dazwischen liegender Sendeblock ist ein anderer Name fur IUS Varianten BearbeitenUbersicht der EBCDIC Codepages mit Latin 1 Zeichensatz Bearbeiten Ubersicht EBCDIC Codepages mit Latin 1 Zeichensatz Codepage Codepagemit Zeichen Lander037 1140 Australien Brasilien Kanada Neuseeland Portugal Sudafrika USA273 1141 Deutschland Osterreich277 1142 Danemark Norwegen278 1143 Finnland Schweden280 1144 Italien284 1145 Lateinamerika Spanien285 1146 Grossbritannien und Nordirland Irland297 1147 Frankreich500 1148 Belgien Kanada Schweiz International871 1149 Island1047 Offene Systeme MVS C Compiler EDF03DRV Deutschland BS2000 OSD EBCDIC 037 Bearbeiten EBCDIC 037 ist eine Variante des EBCDIC Codes Er wird praktisch ausschliesslich auf IBM Grossrechnern zur Darstellung des Zeichensatzes der englischen und portugiesischen Sprachen verwendet Codepage 037Australien Brasilien Kanada Neuseeland Portugal Sudafrika USA 0 1 2 3 4 5 6 7 8 9 A B C D E F4 a a a a a a c n lt 4 4hex 0100bin 5 amp e e e e i i i i ss 5 5hex 0101bin 6 A A A A A A C N gt 6 6hex 0110bin 7 o E E E E I I I I 7 7hex 0111bin 8 O a b c d e f g h i d y th 8 8hex 1000bin 9 j k l m n o p q r ª º ae AE 9 9hex 1001bin A µ s t u v w x y z D Y TH A Ahex 1010bin B c B Bhex 1011bin C A B C D E F G H I o o o o o C Chex 1100bin D J K L M N O P Q R u u u u y D Dhex 1101bin E S T U V W X Y Z O O O o O E Ehex 1110bin F 0 1 2 3 4 5 6 7 8 9 U U U U F Fhex 1111bin 0 1 2 3 4 5 6 7 8 9 A B C D E F40hex Leerzeichen 41hex geschutztes Leerzeichen CAhex weicher kurzer Trennstrich FFhex Steuerzeichen EBCDIC EBCDIC 273 Bearbeiten EBCDIC 273 ist eine Variante des EBCDIC Codes Er wird zur Darstellung des Zeichensatzes der deutschen Sprache verwendet praktisch ausschliesslich auf IBM Grossrechnern Codepage 273Deutschland Osterreich 0 1 2 3 4 5 6 7 8 9 A B C D E F4 a a a a a c n A lt 4 4hex 0100bin 5 amp e e e e i i i i U 5 5hex 0101bin 6 A A A A A C N o gt 6 6hex 0110bin 7 o E E E E I I I I 7 7hex 0111bin 8 O a b c d e f g h i d y th 8 8hex 1000bin 9 j k l m n o p q r ª º ae AE 9 9hex 1001bin A µ ss s t u v w x y z D Y TH A Ahex 1010bin B c B Bhex 1011bin C a A B C D E F G H I o o o o C Chex 1100bin D u J K L M N O P Q R u u u y D Dhex 1101bin E O S T U V W X Y Z O O o O E Ehex 1110bin F 0 1 2 3 4 5 6 7 8 9 U U U F Fhex 1111bin 0 1 2 3 4 5 6 7 8 9 A B C D E F40hex Leerzeichen 41hex geschutztes Leerzeichen CAhex weicher kurzer Trennstrich FFhex Steuerzeichen EBCDIC EBCDIC 500 Bearbeiten EBCDIC 500 ist eine Variante des EBCDIC Codes Er wird zur Darstellung des internationalen Zeichensatzes verwendet praktisch ausschliesslich auf IBM Grossrechnern Codepage 500Belgien Kanada Schweiz International 0 1 2 3 4 5 6 7 8 9 A B C D E F4 a a a a a a c n lt 4 4hex 0100bin 5 amp e e e e i i i i ss 5 5hex 0101bin 6 A A A A A A C N gt 6 6hex 0110bin 7 o E E E E I I I I 7 7hex 0111bin 8 O a b c d e f g h i d y th 8 8hex 1000bin 9 j k l m n o p q r ª º ae AE 9 9hex 1001bin A µ s t u v w x y z D Y TH A Ahex 1010bin B c B Bhex 1011bin C A B C D E F G H I o o o o o C Chex 1100bin D J K L M N O P Q R u u u u y D Dhex 1101bin E S T U V W X Y Z O O O o O E Ehex 1110bin F 0 1 2 3 4 5 6 7 8 9 U U U U F Fhex 1111bin 0 1 2 3 4 5 6 7 8 9 A B C D E F40hex Leerzeichen 41hex geschutztes Leerzeichen CAhex weicher kurzer Trennstrich FFhex Steuerzeichen EBCDIC EBCDIC 1140 Bearbeiten EBCDIC 1140 ist eine Variante des EBCDIC Codes Er wird praktisch ausschliesslich auf IBM Grossrechnern zur Darstellung des Zeichensatzes der englischen und portugiesischen Sprachen verwendet Sie entspricht der Codepage 037 und unterscheidet sich von ihr nur in der Position 9F wo sich statt des internationalen Wahrungssymbols das Eurozeichen befindet Codepage 1140Australien Brasilien Kanada Neuseeland Portugal Sudafrika USA 0 1 2 3 4 5 6 7 8 9 A B C D E F4 a a a a a a c n lt 4 4hex 0100bin 5 amp e e e e i i i i ss 5 5hex 0101bin 6 A A A A A A C N gt 6 6hex 0110bin 7 o E E E E I I I I 7 7hex 0111bin 8 O a b c d e f g h i d y th 8 8hex 1000bin 9 j k l m n o p q r ª º ae AE 9 9hex 1001bin A µ s t u v w x y z D Y TH A Ahex 1010bin B c B Bhex 1011bin C A B C D E F G H I o o o o o C Chex 1100bin D J K L M N O P Q R u u u u y D Dhex 1101bin E S T U V W X Y Z O O O o O E Ehex 1110bin F 0 1 2 3 4 5 6 7 8 9 U U U U F Fhex 1111bin 0 1 2 3 4 5 6 7 8 9 A B C D E F40hex Leerzeichen 41hex geschutztes Leerzeichen CAhex weicher kurzer Trennstrich FFhex Steuerzeichen EBCDIC EBCDIC 1141 Bearbeiten EBCDIC 1141 ist eine Variante des EBCDIC Codes Er wird zur Darstellung des Zeichensatzes der deutschen Sprache verwendet praktisch ausschliesslich auf IBM Grossrechnern Sie entspricht der Codepage 273 und unterscheidet sich von ihr nur in der Position 9F wo sich statt des internationalen Wahrungssymbols das Eurozeichen befindet Codepage 1141Deutschland Osterreich 0 1 2 3 4 5 6 7 8 9 A B C D E F4 a a a a a c n A lt 4 4hex 0100bin 5 amp e e e e i i i i U 5 5hex 0101bin 6 A A A A A C N o gt 6 6hex 0110bin 7 o E E E E I I I I 7 7hex 0111bin 8 O a b c d e f g h i d y th 8 8hex 1000bin 9 j k l m n o p q r ª º ae AE 9 9hex 1001bin A µ ss s t u v w x y z D Y TH A Ahex 1010bin B c B Bhex 1011bin C a A B C D E F G H I o o o o C Chex 1100bin D u J K L M N O P Q R u u u y D Dhex 1101bin E O S T U V W X Y Z O O o O E Ehex 1110bin F 0 1 2 3 4 5 6 7 8 9 U U U F Fhex 1111bin 0 1 2 3 4 5 6 7 8 9 A B C D E F40hex Leerzeichen 41hex geschutztes Leerzeichen CAhex weicher kurzer Trennstrich FFhex Steuerzeichen EBCDIC EBCDIC 1148 Bearbeiten EBCDIC 1148 ist eine Variante des EBCDIC Codes Er wird zur Darstellung des internationalen Zeichensatzes verwendet praktisch ausschliesslich auf IBM Grossrechnern Sie entspricht der Codepage 500 und unterscheidet sich von ihr nur in der Position 9F wo sich statt des internationalen Wahrungssymbols das Eurozeichen befindet Codepage 1148Belgien Kanada Schweiz International 0 1 2 3 4 5 6 7 8 9 A B C D E F4 a a a a a a c n lt 4 4hex 0100bin 5 amp e e e e i i i i ss 5 5hex 0101bin 6 A A A A A A C N gt 6 6hex 0110bin 7 o E E E E I I I I 7 7hex 0111bin 8 O a b c d e f g h i d y th 8 8hex 1000bin 9 j k l m n o p q r ª º ae AE 9 9hex 1001bin A µ s t u v w x y z D Y TH A Ahex 1010bin B c B Bhex 1011bin C A B C D E F G H I o o o o o C Chex 1100bin D J K L M N O P Q R u u u u y D Dhex 1101bin E S T U V W X Y Z O O O o O E Ehex 1110bin F 0 1 2 3 4 5 6 7 8 9 U U U U F Fhex 1111bin 0 1 2 3 4 5 6 7 8 9 A B C D E F40hex Leerzeichen 41hex geschutztes Leerzeichen CAhex weicher kurzer Trennstrich FFhex Steuerzeichen EBCDIC EBCDIC Variante EBCDIC DF 03 DRV CCSN EDF03DRV Bearbeiten EBCDIC DF 03 DRV oder CCSN EDF03DRV ist eine Variante des EBCDIC Codes die auf Fujitsu Grossrechnern unter dem Betriebssystem BS2000 OSD zur Darstellung des deutschen Zeichensatzes verwendet wird Diese Variante weicht speziell bei der Definition der deutschen Umlaute von anderen EBCDIC Varianten ab EBCDIC DF 03 DRVDeutsch 0 1 2 3 4 5 6 7 8 9 A B C D E F4 lt o 4 4hex 0100bin 5 amp 5 5hex 0101bin 6 gt 6 6hex 0110bin 7 7 7hex 0111bin 8 a b c d e f g h i 8 8hex 1000bin 9 j k l m n o p q r 9 9hex 1001bin A s t u v w x y z A Ahex 1010bin B A O U B Bhex 1011bin C A B C D E F G H I C Chex 1100bin D J K L M N O P Q R D Dhex 1101bin E S T U V W X Y Z E Ehex 1110bin F 0 1 2 3 4 5 6 7 8 9 a u ss F Fhex 1111bin 0 1 2 3 4 5 6 7 8 9 A B C D E F40hex LeerzeichenEine weitere Besonderheit in diesem Zeichensatz ist die Doppelbelegung der Zeichen an den Positionen 4Fhex oder o 7Chex oder BBhex oder A BChex oder O BDhex oder U FBhex oder a FDhex oder u FFhex oder ssDie Darstellung wird am BS2000 OSD ausschliesslich durch die verwendete Hardware bzw durch die verwendeten Schriften unterschieden Anekdotisches Bearbeiten2021 bestand ein Bankkunde auf der korrekten Schreibweise seines Nachnamens inkl Akutzeichen e Das Gericht gab der Klage statt auf Basis der Europaischen Datenschutzgrundverordnung Artikel 16 Recht auf Berichtigung Die belgische Bank argumentierte vergeblich dass ihr 1995 eingefuhrtes System zur Verwaltung der Kundendaten die Zeichenkodierung EBCDIC verwende die dieses Zeichen nicht unterstutze 4 Weblinks BearbeitenCode page identifiers Ausfuhrliche IBM Ubersicht der verschiedenen EBCDIC codepages Memento vom 9 Mai 2018 im Internet Archive EBCDIC Codepages mit Latin 1 Zeichensatz Definition von UTF EBCDICEinzelnachweise Bearbeiten The EBCDIC character set ibm com abgerufen am 26 Oktober 2021 a b Appendix G Control Character Mappings In Character Data Representation Architecture Reference IBM ibm com PDF S 311 a b Dik T Winter Standards on Codes Nicht mehr online verfugbar Archiviert vom Original am 16 Juni 2007 abgerufen am 13 August 2007 https www gegevensbeschermingsautoriteit be publications arrest van 9 oktober 2019 van het marktenhof pdf Abgerufen von https de wikipedia org w index php title Extended Binary Coded Decimal Interchange Code amp oldid 238503267