Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Unicode geldt als een industriële standaard, met als objectief het verschaffen van de nodige middelen waarbij teksten van alle vormen en talen kunnen geëncodeerd worden voor gebruik door computers door middel van één tekenset. |
Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Tekens werden in computers oorspronkelijk voorgesteld door het gebruik van byte-brede data: elk afdrukbaar teken (en vele niet-afdrukbare, of "controle"-tekens) werden geïmplementeerd door één enkele byte, hetgeen in totaal 256 tekens toeliet. |
However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
Globalisatie heeft echter een behoefte gecreëerd voor computers die geschikt zijn om verschillende alfabetten (en andere schrijfsystemen) van overal ter wereld in elkaar om te zetten. |
The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
De oude encoderingen die gebruikt werden waren ASCII of EBCDIC, maar het was duidelijk dat deze niet in staat waren om alle verschillende tekens en alfabetten, over de hele wereld, te behandelen. |
The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
De oplossing van dit probleem betrof een set van "brede" 16-bit tekens dat, theoretisch gezien, geschikt zou zijn voor de meeste internationale taaltekens.
|
This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
Deze nieuwe tekenset was eerst bekend als de universele tekenset (Universal Character Set - UCS), en later gestandaardiseerd als Unicode. |
However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
Echter, na de eerste uitvoeringen van de Unicode standaard, werd duidelijk dat 65.535 (216) tekens nog steeds niet voldoende zou zijn om ieder teken, uit alle bestaande schriften, voor te stellen, dus werd de standaard gewijzigd om zestien bijkomstige vlakken van 65.536 tekens ieder toe te voegen, waardoor het totaal aantal mogelijke voorgestelde tekens op 1.114.112 werd gebracht. |
To this date, less than 10% of that space is in use. |
Tot op heden wordt minder dan 10% van deze ruimte gebruikt. |