| Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Unicode é um padrão da indústria cujo objetivo é fornecer os meios pelos quais textos de todos os formatos e idiomas podem ser codificados para uso por computadores por meio de um único conjunto de caracteres.
|
| Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Originalmente, os caracteres de texto eram representados em computadores usando dados de bytes: cada caractere imprimível (e muitos caracteres não imprimíveis, ou de "controle") eram implementados usando um único byte cada, o que permitia um total de 256 caracteres. |
| However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
No entanto, a globalização criou a necessidade de que os computadores sejam capazes de acomodar muitos alfabetos diferentes (e outros sistemas de escrita) de todo o mundo de forma intercambiável. |
| The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
As codificações antigas em uso incluíam ASCII ou EBCDIC, mas era evidente que elas não eram capazes de lidar com todos os diferentes caracteres e alfabetos do mundo todo. |
| The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
A solução para esse problema foi criar um conjunto de caracteres "amplos" de 16 bits que, teoricamente, seriam capazes de acomodar a maioria dos caracteres de idiomas internacionais. |
| This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
Esse novo conjunto de caracteres foi inicialmente conhecido como Conjunto de Caracteres Universal (UCS) e posteriormente padronizado como Unicode. |
| However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
Entretanto, após as primeiras versões do padrão Unicode, ficou claro que 65.535 (216) caracteres ainda não seriam suficientes para representar todos os caracteres de todos os scripts existentes, então o padrão foi alterado para adicionar dezesseis planos suplementares de 65.536 caracteres cada, elevando assim o número total de pontos de código representáveis para 1.114.112. |
| To this date, less than 10% of that space is in use. |
Até o momento, menos de 10% desse espaço está em uso. |