Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Unicode ist ein Branchenstandard, dessen Ziel es ist, die Möglichkeit zu bieten, Texte aller Formen und Sprachen über einen einzigen Zeichensatz für die Verwendung durch Computer zu codieren. |
Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Ursprünglich wurden Textzeichen in Computern mit byte-breiten Daten dargestellt: Jedes druckbare Zeichen (sowie viele nicht druckbare oder "Steuer" Zeichen) wurde mit einem einzelnen Byte implementiert, was insgesamt 256 Zeichen ermöglichte. |
However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
Jedoch hat die Globalisierung den Bedarf geschaffen, dass Computer in der Lage sein müssen, viele verschiedene Alphabete (und andere Schriftsysteme) aus der ganzen Welt auf eine austauschbare Weise zu verarbeiten.
|
The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
Die bisherigen Codierungen wie ASCII oder EBCDIC waren jedoch offensichtlich nicht in der Lage, alle unterschiedlichen Zeichen und Alphabete aus der ganzen Welt zu handhaben. |
The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
Die Lösung für dieses Problem bestand darin, einen Satz von "wide" 16-Bit-Zeichen zu erstellen, der theoretisch die meisten internationalen Sprachzeichen aufnehmen könnte. |
This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
Dieser neue Zeichensatz wurde zunächst als Universal Character Set (UCS) bezeichnet und später als Unicode standardisiert. |
However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
Allerdings wurde nach den ersten Versionen des Unicode-Standards deutlich, dass 65.535 (216) Zeichen immer noch nicht ausreichen würden, um jedes Zeichen aus allen existierenden Schriften darzustellen. Daher wurde der Standard dahingehend ergänzt, dass sechzehn ergänzende Ebenen mit jeweils 65.536 Zeichen hinzugefügt wurden. Dadurch stieg die Gesamtzahl der darstellbaren Codepunkte auf 1.114.112. |
To this date, less than 10% of that space is in use. |
Bis heute wird jedoch weniger als 10% dieses Bereichs verwendet.
|