Definition

Unicode

Für die Darstellung von Text in der Computerverarbeitung definiert der Unicode-Standard Codes für Zeichen, die in allen wichtigen Sprachen vorkommen. Dazu gehören die europäischen alphabetischen, die Rechts-nach-Links-Schriften des Nahen Ostens und viele asiatische Schriften. Er unterstützt auch viele klassische und historische Texte in einer Reihe von Sprachen und umfasst über 135,000 Zeichen.

Der Standard wird vom Unicode Consortium betreut. Die erste Version von Unicode wurde im Oktober 1991 veröffentlicht. Zum Redaktionsschluss im November 2022 war die Version 15.0.0 aktuell.

Die offizielle Bezeichnung ist Unicode Worldwide Character Standard. Der Standard ist vollständig kompatibel mit dem Universal Coded Character Set (UCS) des internationalen Standards ISO/IEC 10646. Unicode beinhaltet aber zusätzliche Informationen über die Zeichen und ihre Verwendung. Unicode und ISO/IEC 10646 unterstützen die Kodierungsformen UTF-8, UTF-16 und UTF-32 und ermöglichen das Codieren von bis zu einer Million Zeichen.

UTF-8 wird beispielsweise bei HTML verwendet, UTF-16 und UTF-32 unterscheiden sich beim Speicherplatzbedarf.

Diese Definition wurde zuletzt im November 2022 aktualisiert

Erfahren Sie mehr über Softwareentwicklung

ComputerWeekly.de
Close