Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Unicode is een industriestandaard die tot doel heeft een manier te bieden om teksten in iedere vorm of taal te coderen met één enkele karakterset om gebruikt te worden door computers. |
Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Oorspronkelijk werden lettertekens door computers weergegeven door middel van bytes: ieder afdrukbaar letterteken (en vele niet-afdrukbare 'controle' tekens) werden voorgesteld door één byte, waardoor er in totaal 256 mogelijke lettertekens waren. |
However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
De globalisatie maakte het echter noodzakelijk om computers op een dynamische manier te laten werken met vele soorten alfabetten (en andere schriftsystemen) afkomstig uit de hele wereld. |
The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
De oude coderingen zoals ASCII en EBCDIC bleken niet in staat om te gaan met de verschillende lettertekens en alfabetten die wereledwijd bestaan. |
The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
De oplossing voor dit probleem was het definiëren van een verzameling 'brede' 16-bits lettertekens die teoretisch in staat zou moeten zijn om de meeste internationale taaltekens te bevatten. |
This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
Deze nieuwe karakterset werd bekend onder de naam Universal Character Set (UCS) en werd later gestandardiseerd als Unicode. |
However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
Na de eerste versies van de Unicode standaard werd het echter duidelijk dat 65.535 (2^16) lettertekens nog altijd niet genoeg zou zijn om alle tekens van alle bestaande schriften weer te geven. De standaard werd daarop aangepast door het toevoegen van zestien extra lagen van 65.536 lettertekens per stuk, waardoor er in totaal 1.114.112 codepunten kunnen worden weergegeven. |
To this date, less than 10% of that space is in use. |
Tot op heden wordt minder dan 10% van die ruimte gebruikt. |