Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Unicode is een industriestandaard, bedoeld om de middelen te bieden waarmee elke vorm van tekst en taal kan worden gecodeerd, zodat computers deze kunnen gebruiken, met een enkele tekenreeks. |
Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Van origine werden teksttekens in computers weergegeven met behulp van bytesbrede data: elk printbaar teken (en vele onprintbare, ofwel "controletekens") werden geïmplementeerd door voor elk teken een enkele byte te gebruiken, waardoor er in totaal 256 tekens mogelijk waren. |
However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
Vanwege de globalisatie is het echter nodig voor computers om vele verschillende alfabetten (evenals andere schrijfsystemen) van over de hele wereld te kunnen accommoderen op een manier die uitwisselbaar is. |
The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
De oude gebruikte coderingen waren onder andere ASCII of EBCDIC, maar het was duidelijk dat deze niet geschikt waren om met alle verschillende tekens en alfabetten van over de hele wereld om te gaan. |
The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
De oplossing voor dit probleem was om een reeks van "brede" tekens van 16 bit te creëren, die in theorie de meeste internationale taaltekens zouden moeten kunnen accommoderen. |
This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
Deze nieuwe tekenreeks stond eerder bekend als de Universal Character Set (UCS) en werd later gestandaardiseerd tot Unicode. |
However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
Na de eerste versies van de Unicode-standaard werd het echter duidelijk dat 65.535 (216) tekens nog steeds niet genoeg zouden zijn om elk teken van alle bestaande schriften weer te geven, dus werd de standaard aangepast door zestien aanvullende vlakken van elk 65.536 tekens toe te voegen, waarmee het totale aantal weer te geven codepunten 1.114.112 tekens werd. |
To this date, less than 10% of that space is in use. |
Tot op deze dag is minder dan 10% van die ruimte in gebruik. |