Was ist das Besondere an Domainnamen wie: www.server-kühlung.de, www.föhn.de und www.fährbetriebe.de? Diese Domainnamen beinhalten alle mindestens einen der im Deutschen so häufig verwendeten Umlaute ä, ö und ü. „Ist das ein Problem?“, werden Sie sich jetzt vielleicht fragen. Ja, denn die deutschen Umlaute gehören nicht zum Standardzeichensatz ASCII (American Standard Code for Information Interchange), der als Standard vieler Systeme im Internet verwendet wird und auch dem Domain Name System zugrunde liegt. Das Domain Name System ist dafür zuständig, die Internetadresse (URL) derjenigen IP-Adresse zuzuordnen, unter der die Inhalte der jeweiligen Internetpräsenz gehostet werden.
In der Frühzeit des Internets und auch heute noch konnten und können Zeichen, die nicht zum ASCII-Zeichensatz gehören, vielfach nicht verwendet werden. Sie können von den entsprechenden Anwendungen einfach nicht verarbeitet werden. Bei einigen Domains – insbesondere älteren Country Code Top Level Domains (ccTLD) sind aus diesem Grund nur ASCII-konforme Zeichen bei der Registrierung eines Domainnamens möglich. Top-Level-Domains, die die Registrierung von Sonderzeichen im Domainnamen erlauben, enthalten in ihren Registrierungsrichtlinien den Hinweis: IDN-Domain (Internationalized Domain Name) möglich. Dazu zählen mittlerweile alle durch die ICANN vergeben Domains, insbesondere die neuen generischen Domains. Aber auch viele der älteren Domains ziehen nach. Sollten Sie unsicher sein, ob Ihre gewünschte Domain IDN-Domains ermöglicht, fragen Sie vor der Registrierung am besten Ihren Domainanbieter.
Was ist ein internationalisierter Domainname?
Die IDN-Domain – auch internationalisierter Domainname genannt – bieten eine Lösung für das Problem im Umgang mit Umlauten und Sonderzeichen. Die betreffende Internetadresse wird ASCII-kompatibel kodiert. Diesen Schritt nennt man auch Normalisierung, denn die Adresse wird der ASCII-Norm angepasst.
Zuerst verwendete man dazu das IDN2003-Verfahren. Dabei werden alle Sonderzeichen nach einem bestimmten Algorithmus automatisch konvertiert. Allerdings entstanden daraus weitere Probleme mit bestimmten Sonderzeichen. So wurde zum Beispiel das „ß“ notwendigerweise zu einem „ss“ umgewandelt. In einigen Fällen konnte das dazu führen, dass zwei unterschiedliche Domainnamen auf die gleiche IP-Adresse geleitet werden.
Zum Beispiel:
a) Fußballfieber.de -> konvertiert nach IDN2003 zu -> Fussballfieber.de
b) Fussballfieber.de
Abhilfe sollte die Einführung des IDNA2008 Verfahrens schaffen. Die starre Zuweisung der Umwandungsregel wurde flexibilisiert und den jeweiligen Benutzerschnittstellen überantwortet, um gerade die oben genannten Probleme wie den Umgang mit dem „ß“ zu vermeiden.
Aber auch diakritische Zeichen wie Akzente, die häufig in romanischen Sprachen wie dem Französischen oder Spanischen verwendet werden, stellen ein Problem dar. Der verstärkte Einzug arabischer, asiatischer und afrikanischer Schriftsysteme in die Welt des Internets hat diese Problematik nochmals weiter verschärft.
Besondere Relevanz bekommt hier das Punycode-Verfahren, das als zweiter Schritt auf die Normalisierung folgt. Dabei werden alle Nicht-ASCII-Zeichen aus dem Domainnamen extrahiert und dann als eine End-Sequenz an den Domainnamen angefügt. Der Domainname wird durch die Voranstellung der Buchstabenfolge xn, gefolgt von einem doppelten Bindestrich als konvertierte IDN Domain gekennzeichnet. Man kann sich das – vereinfachend gesagt – wie eine Liste von Entsprechungen vorstellen. Für jedes Sonderzeichen wird eine bestimmte ASCII-Zeichensequenz als Entsprechung festgelegt, sodass diese z.B. von einem Browser problemlos gelesen werden kann. Welche Entsprechung gewählt wird, ist abhängig vom Sonderzeichen selbst und der Umfeld, in dem das Sonderzeichen vorkommt.
Das U-Label und ACE-Form – die beiden Ebenen einer IDN-Domain
Da eine IDN-Domain im Hintergrund immer konvertiert wird, kann man grundsätzlich zwei Ebenen unterscheiden:
1. die IDN-Form: der Domainname, wie man ihn registriert. In unserem Beispiel: fußballfieber.de
2. der ACE-String (die konvertierte Form nach IDNA-Standard und Punycode-Verfahren ). In unserem Beispiel: xn--fuballfieber-m9a.de
Man kann hierbei sehr gut das Prinzip des Punycode-Verfahrens erkennen. Fußballfieber wird normalisiert und das Sonderzeichen „ß“ extrahiert. Die ASCII-kompatible Zeichenfolge fuballfieber bleibt bestehen. Das Sonderzeichen ß wird zu der ASCII-Zeichensequenz m9a umgewandelt, die dann durch einen Bindestrich abgetrennt als Sequenz an den Domainnamen angehängt wird. Die Zeichenfolge xn—macht deutlich, dass es sich um eine IDN-Domain handelt.
In älteren Browsern wurden IDN-Domains oftmals noch als ACE-String dargestellt. Aktuellere Browser können landestypische IDN-Domains in der Regel aber korrekt in ihrer IDN-Form darstellen.
IDN-Konvertierung und neue Domains
Durch die Einführung der neuen generischen Domains hat das Thema IDN-Konvertierung mehr denn je an Aktualität gewonnen. Man denke nur an die Domainnamen in arabischer, hebräischer, thailändischer, japanischer oder chinesischer Sprache, für die jeweils eine ASCII-Konvertierung entwickelt werden musste. Immerhin gehört die chinesische online-Domain (.XN–3DS443G – hier in der konvertierten ASCII-Darstellung) zu den beliebtesten neuen Domainendungen. TOP Level Domains mit außereuropäischen Schriftsystemen wie z.B. chinesische Domainnamen haben aber nicht nur mit dem Problem der Zeichenkonvertierung zu tun: Im Chinesischen kann das gleiche Zeichen auch unterschiedliche Bedeutungen haben. Aus diesem Grund wurden chinesische Zeichen teilweise in zwei- oder mehrfache Weise konvertiert, was letztlich aber zu neuen Problemen führte. In den Guidelines for Chinese Domain Names wurden die Varianten wieder in einem System zusammenzuführen.
Vorsicht bei E-Mail-Adressen mit IDN-Domains
Aktuell unterstützen leider die meisten E-Mailprogramme und E-Mail-Server kein IDN-Domains. Enthält Ihre E-Mai-Adresse einen internationalisierten Domainnamen, kann es zu Problemen beim E-Mail-Versand kommen bzw. der E-Mail-Versand gar nicht möglich sein. Möchten Sie dennoch eine E-Mail-Adresse mit IDN-Domain verwenden, sollten Sie die IDN-Form durch die konvertierte Form, den ACE-String ersetzen.
Eine E-Mail-Adresse zu Ihrer Domain fußballfieber.de wäre dann nicht: info@fußballfieber.de, sondern info@xn--fuballfieber-m9a.de
Das ist eine sichere, wenn auch optisch nicht besonders ansprechende Lösung. Sie können die IDN-Konvertierung Ihrer Domain selbst vornehmen. Die Konvertierungsfunktion finden Sie auf folgender Seite der DENIC: IDN-Konvertierung
Bildnachweis: Fotolia, Lizenz: Host Europe