UTF-8

UTF-8 (8-bit Unicode Transformation Format) bedeutet die Vereinheitlichung für eine globale Zeichenkodierung des Unicode im Internet. Das bezeichnet einen international gültigen Standard, mit dem jedes Schriftzeichen einen digitalen Code erhält. Damit wird daran gearbeitet, dass unterschiedliche Kodierungen, die nicht zueinander passen, zusammengeführt werden. Verschiedene Schriften und Kulturen benutzen teils gegensätzliche Kodierungen, die nicht kompatibel sind und zu fehlerhaften Darstellungen führen können.

UTF-8 ist somit eine globale Standardisierung der Schriftzeichen im Internet. Zunehmend wird auch bei den HTML-Darstellungen auf den UTF-8 zurückgegriffen, um sprachspezifische Eigenheiten anzupassen. Der Code wird beständig erweitert, um auch komplexen Sprachen und Schriften, wie zum Beispiel bei den asiatischen Schriftzeichen, einen weltweit einheitlichen Standard zuzuweisen.

Die ursprüngliche Zeichenkodierung für das Internet erfolgt als ASCII, mit dem maximal 96 Zeichen dargestellt werden konnten. Die Informatik benutzte zu Anfang fast ausschließllich das englische Alphabet, sodass die Zeichenanzahl ausreichend war. Jedoch gab es bereits Probleme bei der Darstellung der deutschen Umlaute, die dann jedoch als HTML Entities eingesetzt wurden. Mit zunehmender Globalisierung wurden auch andere Sprachen und Schriftzeichen integriert, so dass eine einheitliche Kodierung notwendig wurde. UFT-8 ermöglicht durch die Darstellung in 4 Bytes eine Anzahl von 1 114 112 Zeichen, so dass jedes Schriftzeichen, aber auch Noten und andere Bedeutungszeichen dargestellt werden können. Innerhalb eines Dokuments ist es nun leicht, auch verschiedene Sprachen einheitlich zu kodieren.

Mittlerweile wird nicht nur bei der Programmierung einer HTML-Seite oder im Webbrowser UTF-8 benutzt, auch in den E-Mail-Programmen ist der UTF-8 Standard längst alltäglich. Es kann bei der Einrichtung eines neuen Mailprogramms notwendig sein, in den Einstellungen die Darstellung auf UTF-8 umzustellen, in den meisten Fällen wird jedoch die spezielle Einrichtung nicht mehr nötig sein. Einzelne Zeichen im Schriftmodus können einer UTF-8 Zeichentabelle entnommen werden, ebenso ihre Darstellung als Hexadezimalzeichen. UTF-8 ist durch seine Möglichkeiten zur Erweiterung und der einfachen Darstellung aller bedeutungtragenden Schriftzeichen die optimale Kodierung und vereinfacht den Austausch unterschiedlicher Sprachen im Internet.

  • Sie haben Fragen?
    Tel.: 06181 - 502 30 10
    E-Mail: Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!

K

o

n

t

a

k

t