| Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Unicode là một tiêu chuẩn ngành nhằm mục tiêu cung cấp phương tiện mã hóa tất cả các dạng văn bản và ngôn ngữ để sử dụng trên máy tính thông qua một bộ ký tự duy nhất. |
| Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Ban đầu, các ký tự văn bản được biểu diễn trong máy tính bằng cách sử dụng dữ liệu theo byte: mỗi ký tự dạng chữ viết (và nhiều ký tự không phải là chữ viết, hoặc ký tự "điều khiển") được triển khai bằng cách sử dụng một byte duy nhất, cho phép biểu diễn tổng cộng 256 ký tự. |
| However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
Tuy nhiên, toàn cầu hóa đã đặt ra nhu cầu máy tính phải chứa được nhiều bảng chữ cái khác nhau (và các hệ thống chữ viết khác) trên khắp thế giới theo cách có thể chuyển đổi qua lại cho nhau. |
| The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
Các phương thức mã hóa cũ được sử dụng bao gồm ASCII hoặc EBCDIC, nhưng rõ ràng chúng không có khả năng xử lý tất cả các ký tự và bảng chữ cái khác nhau trên khắp thế giới. |
| The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
Giải pháp cho vấn đề này là tạo ra một bộ ký tự "dài" 16 bit, mà về lý thuyết có thể chứa được hầu hết các ký tự ngôn ngữ quốc tế. |
| This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
Bộ ký tự mới này ban đầu được biết tới với tên gọi Bộ ký tự vạn năng (Universal Character Set - UCS), sau này được chuẩn hóa dưới tên gọi Unicode. |
| However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
Tuy nhiên, sau phiên bản đầu tiên của chuẩn Unicode, người ta nhận thấy rằng 65.535 (216) ký tự vẫn không đủ để biểu diễn mọi ký tự từ tất cả các hệ thống chữ viết hiện có, do đó, tiêu chuẩn này đã được sửa đổi để thêm mười sáu mặt phẳng bổ sung, mỗi mặt phẳng chứa 65.536 ký tự, do đó nâng tổng số điểm mã có thể biểu diễn lên tới 1.114.112. |
| To this date, less than 10% of that space is in use. |
Cho đến nay, chưa đến 10% con số đó đang được sử dụng. |