www.wikidata.de-de.nina.az
Als internationalisierte Domainnamen internationalized domain name IDN umgangssprachlich auch Umlautdomain oder Sonderzeichendomain werden Domainnamen bezeichnet die Umlaute diakritische Zeichen oder Buchstaben aus anderen Alphabeten als dem lateinischen Alphabet enthalten Solche Zeichen waren ursprunglich im Domain Name System nicht vorgesehen und wurden nachtraglich durch den Internetstandard Internationalizing Domain Names in Applications IDNA ermoglicht Grundsatzlich sind fast 1 alle Unicode Zeichen in IDNs zulassig Jede Vergabestelle fur Domains regelt jedoch individuell welche Zeichen sie fur Domain Registrierungen erlaubt Der Anteil von IDNs an allen registrierten Domains unterhalb von de betragt rund vier Prozent 2 Inhaltsverzeichnis 1 Funktionsweise 1 1 Inkompatibilitaten von IDNA2003 und IDNA2008 1 2 Beispiel Domains 2 Zeichensatze 3 Unterstutzung im Browser 4 ASCII Spoofing Problematik 5 Siehe auch 6 Weblinks 7 EinzelnachweiseFunktionsweise BearbeitenUnicode Domainnamen werden zu ASCII kompatiblen Kodierungen englisch ASCII compatible encoding ACE umgewandelt Die Umwandlung erfolgt beim Client zum Beispiel dem Browser oder Mailprogramm so dass die Server Infrastruktur nicht angepasst werden muss Statt der Unicode Strings kann der Benutzer im Client auch direkt die ACE Strings eingeben So konnen auch Clients ohne IDN Fahigkeit mit internationalisierten Domains arbeiten sofern der Benutzer den ACE String kennt Dies ist jedoch umstandlicher da man als Benutzer aus einem ACE String den Unicode Domainnamen nicht auf einfache Weise ablesen kann Im ursprunglichen Verfahren IDNA2003 RFC 3490 3 wurden die Domainnamen zunachst durch das Nameprep Verfahren normalisiert Die Normalisierung bestand darin alle Grossbuchstaben durch Kleinbuchstaben zu ersetzen und aquivalente Zeichen auszutauschen So war zum Beispiel ss als aquivalent zu ss spezifiziert so dass die Domainnamen STRasse und strasse identisch waren Mit der neuen Version IDNA2008 die teilweise auch als IDNAbis bekannt geworden ist und von 2008 bis 2010 entwickelt wurde RFC 5890 4 RFC 5891 5 RFC 5892 6 RFC 5893 7 RFC 5894 8 ist die Normalisierung nicht langer Teil von IDNA sondern liegt im Verantwortungsbereich der Benutzerschnittstelle IDNA2008 schreibt zwar keine Normalisierung mehr vor empfiehlt aber einen allgemeinen Algorithmus bei dem die Umwandlung von Gross zu Kleinbuchstaben und ein paar weitere Regeln weiterhin vorgesehen sind Bei de ist es seit dem 16 November 2010 fur Inhaber einer Domain mit ss schon vorher moglich separate Domains mit ss zu registrieren 9 Im Anschluss an die Normalisierung werden mittels Punycode die Nicht ASCII Zeichen aus dem Namen entfernt und am Ende des Namens ein daraus abgeleiteter ASCII String hinzugefugt in dem die Position und Art des Unicode Zeichens kodiert ist Um einen IDN von einem ASCII Domainnamen zu unterscheiden beginnt der Punycode String mit dem Prafix xn Die ungewohnliche Zeichenfolge xn wurde gewahlt weil sie in realen Wortern oder Eigennamen praktisch nicht vorkommt und Konflikte mit ASCII Domains daher ausserst unwahrscheinlich sind Inkompatibilitaten von IDNA2003 und IDNA2008 Bearbeiten Der Unicode Technical Standard 46 10 beschreibt Massnahmen mit denen die Inkompatibilitaten zwischen IDNA2003 und IDNA2008 in der Praxis minimiert werden sollen um den Umstieg von IDNA2003 auf IDNA2008 zu erleichtern Aber auch drei Jahre nach Einfuhrung ist die Browserunterstutzung fur IDNA2008 noch durftig siehe auch Abschnitt Unterstutzung im Browser Da IDNA2003 ss zwingend zu ss umwandelt sind die neuen ss Domains daher oftmals nicht aufrufbar bzw verweisen auf die bisherigen ss Domains Solange ss Domain und ss Domain zum selben Angebot gehoren bekommt der Benutzer davon ublicherweise nichts mit wenn allerdings ss Domain und ss Domain zu unterschiedlichen Angeboten gehoren fuhrt dies mitunter zu Verwirrungen Daruber hinaus erlaubt IDNA2008 etwa 8000 Unicode Zeichen nicht mehr die nach IDNA2003 noch gultige Bestandteile von Domainnamen waren 11 so dass bisher gultige Domainnamen die diese Zeichen enthalten beim Umstieg von IDNA2003 auf IDNA2008 ungultig werden 12 Beispiel Domains Bearbeiten domain example xn dmin moa0i example aaaa example xn aaa pla example aaaa example xn aaa qla example aaaa example xn aaa rla example aaaa example xn aaa sla example deja vu example xn dj kia8a vu example efrain example xn efran 2sa example nandu example xn and 6ma2c example foo abcdef example foo xn bcdf 9na9b example موقع وزارة الاتصالات مصر xn 4gbrim xn ymcbaaajlc6dj7bxne2c xn wgbh1c example xn n3h example erlaubt nach IDNA2003 aber unzulassig nach IDNA2008 12 fussball example xn fuball cta example wird nach IDNA2003 zwingend zu fussball example nicht jedoch nach IDNA2008 Eine Whois Abfrage der Form whois h whois denic de C ISO 8859 1 example com bzw whois h whois denic de C UTF 8 example com auf Unicode basierenden Systemen liefert bei registrierten Domains u a die Schreibweise in Punycode Zeichensatze BearbeitenSeit Mai 2010 gibt es IDN Top Level Domains und damit komplette Domains aus nicht lateinischen Buchstaben 13 So gibt es beispielsweise die Top Level Domain مصر die das arabische Wort fur Agypten Misr darstellt die Website des agyptischen Ministeriums fur Kommunikation und Informationstechnologie ist uber die ausschliesslich aus arabischen Zeichen bestehende Domain bdo dir ltr bdi dir rtl class arabic spanAr style unicode bidi isolate font size 120 موقع وزارة الاتصالات مصر bdi bdo erreichbar Der Domainname ist dabei dem Arabischen entsprechend von rechts nach links zu lesen Viele Top Level Domains lassen verschiedene Schriften zu setzen jedoch voraus dass alle Zeichen eines Domainnamens derselben Schrift zugeordnet sind Eine Vermischung von verschiedenen Schriften ist nicht erlaubt So erlauben com und net beispielsweise insgesamt mehrere zehntausend Zeichen aus mehreren Dutzend Schriften 14 15 Die IANA pflegt ein Repository in dem Registries Tabellen mit den jeweils erlaubten Zeichen pro Schrift ablegen konnen 16 Dieses IDN Repository wird von gTLDs wie org und info sowie von einzelnen ccTLDs genutzt Nachfolgend wird fur einige Top Level Domains aufgelistet welche Nicht ASCII Zeichen in den jeweiligen IDN Domains erlaubt sind at a a a a a a ae c e e e e i i i i d n o o o o o o œ s u u u u y y z th 17 ch und li a a a a a a ae c e e e e i i i i d n o o o o o o œ u u u u y y th 18 de a a a a a a ae a ă a c c ĉ ċ c d đ e e e e e ĕ e e e ĝ g ġ g ĥ ħ i i i i ĩ i ĭ į i d ĵ k ĸ ĺ l ľ l n n n n ŋ o o o o o o ō ŏ o œ ŕ ŗ r s ŝ s s ţ t ŧ u u u u ũ u ŭ u u u ŵ y ŷ y z z z th ss 9 19 eu a a a a a a ae a ă a c c ĉ ċ c d đ e e e e e ĕ e e e ĝ g ġ g ĥ ħ i i i i ĩ i ĭ į i d ĵ k ĺ l ľ ŀ l n n n n ʼn ŋ o o o o o o ō ŏ o œ ŕ ŗ r s ŝ s ș t ŧ ț u u u u ũ u ŭ u u u ŵ y ŷ y z z z th i a e h i y a b g d e z h 8 i k l m n 3 o p r s s t y f x ps w i y o y w a b v g d e zh z i j k l m n o p r s t u f h c ch sh sh y e yu ya ἀ ἁ ἂ ἃ ἄ ἅ ἆ ἇ ἐ ἑ ἒ ἓ ἔ ἕ ἠ ἡ ἢ ἣ ἤ ἥ ἦ ἧ ἰ ἱ ἲ ἳ ἴ ἵ ἶ ἷ ὀ ὁ ὂ ὃ ὄ ὅ ὐ ὑ ὒ ὓ ὔ ὕ ὖ ὗ ὠ ὡ ὢ ὣ ὤ ὥ ὦ ὧ ὰ a ὲ e ὴ h ὶ i ὸ o ὺ y ὼ w ᾀ ᾁ ᾂ ᾃ ᾄ ᾅ ᾆ ᾇ ᾐ ᾑ ᾒ ᾓ ᾔ ᾕ ᾖ ᾗ ᾠ ᾡ ᾢ ᾣ ᾤ ᾥ ᾦ ᾧ ᾰ ᾱ ᾲ ᾳ ᾴ ᾶ ᾷ ῂ ῃ ῄ ῆ ῇ ῐ ῑ ῒ i ῖ ῗ ῠ ῡ ῢ y ῤ ῥ ῦ ῧ ῲ ῳ ῴ ῶ ῷ 20 Unterstutzung im Browser BearbeitenDie Unterstutzung fur internationalisierte Domainnamen ist in aktuellen Browsern gangig zumindest nach IDNA2003 Hingegen wurde IDNA2008 auch im Jahr 2013 von kaum einem Browser unterstutzt 12 21 Einige IDNA2003 fahige Browser Chrome Firefox ab Version 0 8 Konqueror ab KDE 3 2 mit GNU IDN Library Internet Explorer ab Version 7 0 Mozilla Application Suite ab Version 1 4 Netscape Navigator ab Version 7 1 Opera ab Version 7 11 Safari ab Version 1 2 v125 SeaMonkey ab Version 1 0Einige IDNA2008 fahige Browser Stand Dezember 2016 Firefox seit Firefox Nightly 46 0a1 Safari ab Version 10 1 ab webkit org Safari Technology Preview 19 ASCII Spoofing Problematik BearbeitenDie Verwendung von Unicode in Domain Namen macht es einfacher Webseiten mittels homographischem Angriff zu spoofen da es die visuelle Reprasentation der IDN Zeichenfolge in einem Browser manchmal unmoglich macht eine legitime Seite von einer gespooften zu unterscheiden abhangig vom verwendeten Zeichensatz Beispielsweise sieht das Unicode Zeichen U 0430 das kyrillische kleine a aus wie das Unicode Zeichen U 0061 was dem kleinen Buchstaben a des lateinischen Schriftsystems entspricht Besagtes kyrillisches Zeichen ist z B Teil der obigen Liste der moglichen Zeichen innerhalb von eu Siehe auch BearbeitenHomographischer Angriff Uniform Resource Locator Uniform Resource IdentifierWeblinks Bearbeitendenic IDN Web Converter DENIC konvertiert IDNs in ACE String und umgekehrt FAQ zu IDNs DENIC Haufige Fragen zu IDNs und IDN Tauglichkeitstest fur Browser idn swznet de Osterreich Liste der 34 neuen Zeichen at Nicht mehr online verfugbar In nic at Archiviert vom Original am 4 Mai 2016 abgerufen am 24 Januar 2019 Deutschland Liste der 93 neuen Zeichen de DENIC Schweiz Liechtenstein Liste der 32 neuen Zeichen ch und li SWITCH Einzelnachweise Bearbeiten Tabelle der IDNA Zeichen unicode org Statistik der Domainentwicklung auf denic de RFC 3490 Internationalizing Domain Names in Applications IDNA Marz 2003 englisch RFC 5890 Internationalized Domain Names for Applications IDNA Definitions and Document Framework August 2010 englisch RFC 5891 Internationalized Domain Names in Applications IDNA Protocol August 2010 englisch RFC 5892 The Unicode Code Points and Internationalized Domain Names for Applications IDNA August 2010 englisch RFC 5893 Right to Left Scripts for Internationalized Domain Names for Applications IDNA August 2010 englisch RFC 5894 Internationalized Domain Names for Applications IDNA Background Explanation and Rationale August 2010 englisch a b ss kunftig in zulassigem Zeichensatz fur de Domains DENIC Pressemitteilung 26 Oktober 2010 Unicode Technical Standard 46 Unicode IDNA Compatibility Processing The Unicode Consortium englisch abgerufen am 24 Januar 2019 Internationalized Domain Names IDN FAQ How does IDNA2008 differ from IDNA2003 The Unicode Consortium englisch abgerufen am 24 Januar 2019 a b c IDNA Hell Anne van Kesteren 27 November 2012 abgerufen am 24 Januar 2019 Erste komplett nicht lateinische Domains gehen online Heise online verisign com abgerufen am 18 Februar 2023 verisign com abgerufen am 18 Februar 2023 iana org abgerufen am 18 Februar 2023 IDNs Memento vom 10 Februar 2007 im Internet Archive nic at Allgemeine Geschaftsbedingungen fur die Registrierung und Verwaltung von Domain Namen unter ch und li Anhang 2 nic ch IDN Liste DENIC Unterstutzte Schriftzeichen Memento vom 29 Juli 2013 im Internet Archive The European Registry of Internet Domain Names Bug 479520 Mozilla Abgerufen von https de wikipedia org w index php title Internationalisierter Domainname amp oldid 235626421