www.wikidata.de-de.nina.az
Dieser Artikel behandelt die Zeichenkodierung nach ISO Standard Zur Windows Variante siehe Windows 1252 ISO 8859 1 Latin 1 Westeuropaisch 2 Latin 2 Mitteleuropaisch 3 Latin 3 Sudeuropaisch 4 Latin 4 Nordeuropaisch 5 Kyrillisch 6 Arabisch 7 Griechisch 8 Hebraisch 9 Latin 5 Turkisch 10 Latin 6 Nordisch 11 Thai 12 existiert nicht 13 Latin 7 Baltisch 14 Latin 8 Keltisch 15 Latin 9 Westeuropaisch 16 Latin 10 SudosteuropaischISO 8859 1 genauer ISO IEC 8859 1 auch bekannt als Latin 1 ist ein von der ISO zuletzt 1998 aktualisierter Standard fur die Informationstechnik zur Zeichenkodierung mit acht Bit und der erste Teil der Normenfamilie ISO 8859 Die mit sieben Bit kodierbaren Zeichen entsprechen US ASCII mit fuhrendem Nullbit Zusatzlich zu den 95 darstellbaren ASCII Zeichen 2016 7E16 kodiert ISO 8859 1 96 weitere A016 FF16 also insgesamt 191 von theoretisch moglichen 256 28 Den Positionen 0016 1F16 und 7F16 9F16 sind in ISO IEC 8859 und damit ISO IEC 8859 1 keine Zeichen zugewiesen Dieser Bereich wurde bewusst freigehalten um die entsprechenden Bytes fur die Geratesteuerung nutzen zu konnen oder sicherzustellen dass diese bei einer unzureichend spezifizierten Codierung nicht in Konflikt mit solchen Steuerzeichen geraten Die von der IANA definierte Bezeichnung ISO 8859 1 mit Bindestrich steht fur die Kombination der Zeichen dieser Norm mit nicht darstellbaren Steuerzeichen gemass ISO IEC 6429 ISO IEC 8859 1 versucht moglichst viele Zeichen westeuropaischer Sprachen abzudecken Da zur Vollstandigkeit neben dem Eurosymbol vor allem fur Franzosisch einige Zeichen fehlen wurde als Alternative ISO 8859 15 geschaffen ISO 8859 1 ist eng verwandt mit der unter dem Betriebssystem Windows gebrauchlichen 8 Bit Zeichenkodierung Windows 1252 Beide Codierungen unterscheiden sich im Bereich 8016 bis 9F16 Wahrend ISO IEC 8859 1 diesen Bereich frei halt um hier Steuerzeichen kodieren zu konnen belegt ihn Windows 1252 mit weiteren druckbaren Zeichen Damit unterstutzt diese Codierung auch die meisten westeuropaischen Sprachen und enthalt auch alle druckbaren Zeichen von ISO 8859 15 Manche Applikationen vermischen die Definition von ISO 8859 1 und Windows 1252 Da beispielsweise in HTML die zusatzlichen Steuerzeichen aus ISO 8859 1 keine Bedeutung haben werden oft die druckbaren Zeichen aus Windows 1252 verwendet Aus diesem Grund schreibt der neue HTML5 Standard vor dass als ISO 8859 1 markierte Texte als Windows 1252 zu interpretieren sind 1 Im Januar 2019 verwenden 3 5 aller Websites ISO 8859 1 bei fallender Tendenz Latin 1 ist damit nach UTF 8 93 0 die zweithaufigste Kodierung von Websites Windows 1252 wird von 0 6 der Websites verwendet 2 3 Die Unterschiede zwischen all diesen Kodierungen sowie generell mangelnde Konsequenz bei der Unterstutzung verschiedener Zeichensatze sind ein haufiges Interoperabilitatsproblem Auf ISO 8859 1 und den Steuerzeichen aus ISO IEC 6429 basiert ebenfalls die unter dem Betriebssystem AmigaOS gebrauchliche 8 Bit Zeichenkodierung Commodore Amiga die sich lediglich durch vier Modifikationen unterscheidet Aufgrund der weiten Verbreitung von ISO 8859 1 wurde der Unicode Standard gerade so angelegt dass der Unicode Standard eine Erweiterung von ISO 8859 1 ist Ein Zeichen das in ISO 8859 1 durch den Bytewert x kodiert wird belegt deshalb im Unicode Standard den Codepunkt x Die tatsachlich benutzte Bytefolge kann vom Codepunkt abweichen z B bei UTF 8 Kodierung Inhaltsverzeichnis 1 Geschichte 2 Tabellen 2 1 ISO IEC 8859 1 2 2 ISO IEC 8859 1 kombiniert mit Sonderzeichen aus ISO IEC 6429 3 Verwendung 4 Siehe auch 5 Weblinks 6 EinzelnachweiseGeschichte BearbeitenISO 8859 1 basiert auf dem DEC Multinational Character Set das von der Digital Equipment Corporation im Terminal VT220 verwendet wurde Es wurde ursprunglich von der European Computer Manufacturers Association ECMA entwickelt und im Marz 1985 als ECMA 94 veroffentlicht Die zweite Auflage von ECMA 94 enthielt ausserdem ISO 8859 2 ISO 8859 3 und ISO 8859 4 als Teil der Spezifikation 4 Tabellen BearbeitenISO IEC 8859 1 Bearbeiten Code 0 1 2 3 4 5 6 7 8 9 A B C D E F0 nicht belegt1 2 SP amp 3 0 1 2 3 4 5 6 7 8 9 lt gt 4 A B C D E F G H I J K L M N O5 P Q R S T U V W X Y Z 6 a b c d e f g h i j k l m n o7 p q r s t u v w x y z 8 nicht belegt9 A NBSP c ª SHY B µ º C A A A A A A AE C E E E E I I I ID D N O o O O O O U U U U Y TH ssE a a a a a a ae c e e e e i i i iF d n o o o o o o u u u u y th ySP fur englisch space 20hex ist das Leerzeichen NBSP non breaking space A0hex das feste Leerzeichen und SHY soft hyphen ADhex der normalerweise nur an Zeilenenden sichtbar werdende bedingte Trennstrich ISO IEC 8859 1 kombiniert mit Sonderzeichen aus ISO IEC 6429 Bearbeiten Code 0 1 2 3 4 5 6 7 8 9 A B C D E F0 NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI1 DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US2 wie ISO IEC 8859 Windows 125X und US ASCII3 4 5 6 7 DEL8 PAD HOP BPH NBH IND NEL SSA ESA HTS HTJ VTS PLD PLU RI SS2 SS39 DCS PU1 PU2 STS CCH MW SPA EPA SOS SGCI SCI CSI ST OSC PM APCA wie ISO IEC 8859 1 und Windows 1252B C D E F Die IANA hat folgende gleichwertige grossschreibungsunabhangige Bezeichnungen fur diese Codetabelle zum Gebrauch in Internetanwendungen wie etwa MIME registriert ISO 8859 1 1987 ISO 8859 1 ISO 8859 1 ISO IR 100 csISOLatin1 latin1 l1 IBM819 CP819Verwendung BearbeitenISO 8859 1 ist neben US ASCII und UTF 8 einer Unicode Kodierung eine haufig gebrauchte Kodierung fur lateinische Schriften Im Gegensatz zu UTF 8 konnen turkische ungarische und tschechische Zeichen nicht vollstandig verwendet werden Fur mindestens folgende Sprachen reicht ISO 8859 1 aus Englisch ausser Gebrauch AE ae a e i o u nicht Œ œ Deutsch A a O o U u ss in Fremdwortern E e nicht ẞ ſ ausser Gebrauch Nordfriesisch A a O o U u A a nicht A a Đ đ E e fur Solring Niederlandisch y E e I i seltener A a E e I i o o U u nicht IJ ij Wallonisch A a A a C c E e E e E e I i O o U u Afrikaans E e E e I i I i O o U u Danisch A a AE ae O o Schwedisch A a A a O o Norwegisch Bokmal und Nynorsk A a AE ae O o O o Faroisch A a D d I i o o U u Y y AE ae O o Islandisch A a D d E e I i o o U u Y y TH th AE ae O o Franzosisch AE ae A a A a E e E e E e E e I i I i O o U u U u C c U u y nicht Œ œ Ÿ Italienisch A a E e E e I i O o U u Ratoromanisch A a A a A a E e E e E e I i I i O o o o O o U u nicht S s Katalanisch A a C c E e E e I i I i O o o o U u U u nicht Ŀ ŀ Spanisch ª º A a E e I i N n o o U u U u ausser Gebrauch C c Portugiesisch ª º A a A a A a A a C c E e E e I i o o O o O o U u U u Irisches Galisch neue Orthographie A a E e I i o o U u Schottisches Galisch A a E e E e I i O o o o U u Finnisch A a O o in Fremdwortern A a nicht S s Z z Estnisch A a O o U u O o in Fremdwortern nicht S s Z z Albanisch C c E e Baskisch N n SwahiliAlle Sprachen in der EU nicht Nicht vollstandig in ISO 8859 1 codiert werden konnen folgende Zeichen die genannten Sprachen werden somit nur teilweise unterstutzt Tschechisch C c D d E e N n R r S s T t U u Z z Ungarisch O o U u Turkisch G g I i S s Da die unterstutzten Sprachen in Westeuropa Amerika und Australien weitverbreitet sind war es uberall dort die dominierende 8 Bit Zeichenkodierung Neue Systeme verwenden UTF 8 Auch in Teilen Afrikas in denen nicht die arabische Schrift verwendet wird ist es weit verbreitet obwohl oft einige Sonderzeichen fehlen die aber auch in keiner anderen 8 Bit Kodierung vorhanden sind siehe z B pannigerianisches Alphabet Verwendung diakritischer Zeichen Code 0 1 2 3 4 5 6 7 8 9 A B C D E FC E A a A a A a A a A a A a AE ae C c E e E e E e E e I i I i I i I ifraitacatporsco faogleislporspa fraporwln por deuengestfinswe danfinnorswewln danengfaofraislnor albfracatporwln afrfraitacatscowln afrfragleislitacatporspawln afrfraporwln afralbengfra sco faogleislcatporspa afrfrawln afrengfracatD F D d N n O o o o O o O o O o O o U u U u U u U u Y y TH th ss yfaoisl baqspa itacatsco faogleislcatporspa afrfraporwln estpor deuengestfinislswe danfaonor fraitasco faogleislcatporspa afrfrawln deuengestfracatporspa faoisl isl deuestfranldSiehe auch BearbeitenWindows 1252 Commodore Amiga DEC Multinational Character Set MacRoman DIN 91379 Zeichen und definierte Zeichensequenzen in Unicode fur die elektronische Verarbeitung von Namen und den Datenaustausch in EuropaWeblinks BearbeitenISO 8859 1 Mapping bei Unicode org Windows 1252 Mapping bei Unicode orgEinzelnachweise Bearbeiten HTML 5 1 Nightly Editor s Draft 19 February 2013 8 2 2 2 Character encodings aufgerufen am 19 Februar 2013 Character encoding w3techs com Faq w3techs com ECMA Hrsg Standard ECMA 94 8 Bit Single Byte Coded Graphic Character Sets 2 Auflage Juni 1984 ecma international org PDF 2 7 MB abgerufen am 4 Januar 2008 Abgerufen von https de wikipedia org w index php title ISO 8859 1 amp oldid 232649250