Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Юникод - промышленный стандарт, назначение которого состоит в том, чтобы предоставить средства кодирования текстов любой формы и любого языка для применения в компьютерной технике с использованием единого набора символов. |
Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Изначально, текстовые символы представлялись в компьютерной технике данными размером в байт: каждый печатаемый символ (а также многие непечатаемые или "управляющие" символы) кодировался одним байтом, что давало возможность использовать всего 256 символов. |
However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
Однако, глобализация породила необходимость приспосабливать компьютерную технику к различным алфавитам (и прочим системам письма) со всего света, при этом обеспечивая взаимозаменяемость. |
The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
Старые используемые кодировки включали в себя ASCII или EBCDIC, но было очевидным, что они не способны передать все различные символы и алфавиты со всего света. |
The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
Решением этой проблемы стало создание "расширенных" 16-битных симолов, которые теоретически могли бы передать большинство символов мировых языков. |
This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
Этот новый набор символов сначала был назван Универсальным Набором Символов (UCS), а затем стандартизован как Юникод. |
However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
Однако, после первых версий стандарта Юникод стало понятно, что 65535 (два в шестнадцатой степени) символов по-прежнему недостаточно для того, чтобы представить все символы всех существующих текстов, поэтому стандарт был улучшен и в него были добавлены шестнадцать дополнительных уровней по 65535 символов каждый, таким образом число представимых кодами символов стало равным 1114112. |
To this date, less than 10% of that space is in use. |
На сегодняшний день, занято менее 10% этого пространства. |