Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Unicode é um padrão industrial em que o objetivo é fornecer os meios pelos quais o texto de todas as formas e linguagens possa ser codificado para ser usado no computador através de um conjunto único de caracteres. |
Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Originalmente, os caracteres de texto foram representados nos computadores usando dados em tamanhos de byte: cada caractere imprimível (e muitos caracteres "de controle" ou não-imprimíveis) foi implementado usando, cada um, um único byte, o que permitiu um total de 256 caracteres. |
However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
Contudo, com a globalização, tornaram-se necessários computadores que pudessem acomodar os diversos alfabetos diferentes (além de outros sistemas de escrita) do mundo todo de maneira intercambiável. |
The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
As decodificações antigas em uso incluem ASCII ou EBCDIC, mas, tornou-se evidente que não são capazes de trabalhar com todos os diferentes caracteres e alfabetos mundiais. |
The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
A solução para este problema foi criar um conjunto de caracteres com "tamanho" de 16-bit que pudesse, em teoria, ser capaz de acomodar a maioria dos caracteres de linguagem internacional. |
This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
Este novo conjunto de caracteres ficou conhecido primeiro como Universal Character Set (UCS) (Conjunto Universal de Caracteres), mais tarde, foi padronizado como Unicode. |
However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
Contudo, após as primeiras versões do padrão Unicode ficou claro que 65.535 (216) caracteres ainda não seriam suficientes para representar todos os caracteres de todos os scripts existentes, então, o padrão foi alterado para adicionar dezesseis planos suplementares de 65.536 caracteres cada, apresentando então, o número total de 1.114.112 pontos representáveis de código. |
To this date, less than 10% of that space is in use. |
Até o momento, menos de 10% deste espaço está em uso. |