Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Unicode é um padrão de indústria cujo objetivo é prover um meio através do qual textos em quaisquer formas e linguagens possam ser codificados para o uso por computadores através de um único conjunto de caracteres. |
Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Originalmente, caracteres de texto eram representados em computadores usando um dado de byte único: cada caractere visível (e muitos invisíveis, ou caracteres de "controle") eram implementados usando um byte cada, o que permitia 256 caracteres no total. |
However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
No entanto, a globalização tornou necessário que computadores sejam capazes de acomodar muitos alfabetos diferentes (e outros sistemas de escrita) de todo o mundo de uma forma intercambiável. |
The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
As codificações antigas em uso incluem a ASCII e a EBCDIC, mas era aparente que elas não eram capazes de lidar com todos os caracteres e alfabetos diferentes de todo o mundo. |
The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
A solução para esse problema era criar um conjunto de caracteres "largos" de 16 bits que teoricamente seriam capazes de acomodar a maioria dos caracteres das linguagens internacionais. |
This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
Este novo conjunto de caracteres foi inicialmente conhecido como o Universal Character Set (USC, traduzido como Conjunto de Caracteres Universal), e mais tarde padronizado como Unicode. |
However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
Apesar disso, depois das primeiras versões do padrão Unicode se tornou claro que 65.535 (216) caracteres ainda não seriam o suficiente para representar todos os caracteres de todas as escritas existentes, então o padrão foi ampliado para incluir dezesseis planos suplementares de 65.536 caracteres cada, tornando então o total de códigos de texto representáveis para 1.114.112. |
To this date, less than 10% of that space is in use. |
Até hoje, menos de 10% deste espaço é utilizado. |