| Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Unicode — це стандарт індустрії, метою якого є забезпечення способу, за допомогою якого текст усіх форм і мов може бути закодований для використання комп’ютерами через єдиний набір символів. |
| Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Спочатку текстові символи у комп’ютерах представлялися за допомогою байтових даних: кожен друкований символ (а також багато недрукованих або "керуючих" символів) реалізовувався за допомогою одного байта, що дозволяло використовувати загалом 256 символів. |
| However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
Однак глобалізація створила потребу в тому, щоб комп’ютери могли підтримувати багато різних алфавітів (та інших систем письма) з усього світу у взаємозамінний спосіб. |
| The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
Старі кодування, що використовувалися, включаючи ASCII чи EBCDIC, очевидно були не здатні опрацьовувати всі символи та алфавіти світу. |
| The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
Рішенням цієї проблеми стало створення набору "широких" 16-бітних символів, які теоретично могли б вмістити більшість символів міжнародних мов. |
| This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
Цей новий набір символів спочатку був відомий як Універсальний набір символів (UCS), а пізніше стандартизований під назвою Unicode. |
| However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
Однак після перших версій стандарту Unicode стало зрозуміло, що 65 535 (2¹⁶) символів усе ж буде недостатньо для представлення кожного знака з усіх існуючих систем письма, тому стандарт було доповнено шістнадцятьма додатковими площинами по 65 536 символів у кожній, що розширило загальну кількість можливих кодових позицій до 1 114 112. |
| To this date, less than 10% of that space is in use. |
На сьогодні використовується менше ніж 10 % цього простору. |