Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Unicode é um padrão da indústria cujo objetivo é fornecer maneiras para que todos os sistemas de escrita de todos idiomas possam ser codificados para um único conjunto de caracteres a ser usado por computadores. |
Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Originalmente, os caracteres de texto eram representados em computadores usando dados de byte: sendo que cada caractere imprimível (e muitos caracteres não imprimíveis, chamados de "caracteres de controle") eram implementados usando um único byte, o que permitia um total de 256 caracteres. |
However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
No entanto, a globalização levou os computadores a uma necessidade de acomodar muitos alfabetos diferentes (e outros sistemas) duma forma que fosse possível o intercâmbio de dados no mundo todo. |
The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
Os antigos codificadores em uso incluíam ASCII ou EBCDIC, mas era evidente que não eram capazes de lidar com todos os diferentes caracteres e alfabetos do mundo inteiro. |
The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
A solução para esse problema foi criar um conjunto de caracteres "amplos" de 16 bits que teoricamente seria capaz de acomodar a maioria dos caracteres de idiomas internacionais. |
This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
Este novo conjunto de caracteres foi inicialmente conhecido como Conjunto Universal de Caracteres Codificados (em inglês: Universal Character Set - UCS), e mais tarde padronizado como Unicode. |
However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
No entanto, após as primeiras versões do padrão Unicode ficou claro que 65.535 (216) caracteres ainda não seriam suficientes para representar todos os caracteres de todos as escritas existentes, então, o padrão foi alterado para adicionar dezesseis planos suplementares de 65.536 caracteres cada, assim trazendo o número total de pontos de código representáveis para 1.114.112. |
To this date, less than 10% of that space is in use. |
Até hoje menos de 10% desse espaço está em uso. |