Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Unicode é uma norma da indústria com o objectivo de possibilitar que texto de todos os formatos e línguas possa ser codificado para uso com computadores até de um conjunto de caracteres. |
Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Originalmente, os caracteres de texto eram representados nos computadores através de dados de byte-wide: cada caracter impresso (e muitos não-impressos, ou caracteres de "controlo") eram implementados através de um byte para cada um, o que permitia um total de 256 caracteres. |
However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
Contudo, a globalização criou uma necessidade para que os computadores consigam acomodar diferentes alfabetos (e outros sistemas de escrita) de várias partes do mundo de forma permutável. |
The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
Codificações antigas que estavam em uso incluíam ASCII e EBCDIC, mas era aparente que não possibilitavam o processamento de todos os caracteres e alfabetos diferentes no mundo. |
The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
A solução para este problema foi criar um conjunto de caracteres amplos de 16-bits que poderiam, teoricamente, acomodar maior parte dos caracteres nternacionais de línguas. |
This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
O novo charset era inicialmente conhecido como Universal Character Set (UCS), sendo depois normalizado para Unicode. |
However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
Contudo, após as primeiras versões da norma Unicode, tornou-se claro que 65,535 (216) caracteres não seria ainda suficiente para representar todos os caracteres de todos os sistemas de escrita existentes. Por isso, a norma foi alterada para adicionar seis planos de 65,536 caracteres cada, trazendo assim um número total de pontos de códigos representáveis para 1,114,112. |
To this date, less than 10% of that space is in use. |
Até aos dias de hoje, apenas 10% desse espaço é usado. |