| Unicode is an industry standard whose goal is to provide the means by which text of all forms and languages can be encoded for use by computers through a single character set. |
Unicodena tunnettu teollisuusstandardi pyrkii olemaan menetelmä tekstin koodaamiseen muodosta ja kielestä riippumatta yhden merkistön avulla. |
| Originally, text-characters were represented in computers using byte-wide data: each printable character (and many non-printing, or "control" characters) were implemented using a single byte each, which allowed for 256 characters total. |
Alun perin tekstimerkkien esittämiseen käytettiin tavun mittaisia tietoelementtejä: kukin tulostuva merkki (ja usea tulostumaton tai ohjausmerkki) toteutettiin yhdellä tavulla, joten merkkejä saattoi esittää yhteensä 256. |
| However, globalization has created a need for computers to be able to accommodate many different alphabets (and other writing systems) from around the world in an interchangeable way. |
Globalisaation myötä tietokoneille syntyi kuitenkin tarve esittää useita aakkosia (ja muita kirjoitusjärjestelmiä) maailman eri osista välitettävässä muodossa. |
| The old encodings in use included ASCII or EBCDIC, but it was apparent that they were not capable of handling all the different characters and alphabets from around the world. |
Vanhoihin koodausjärjestelmiin kuuluivat ASCII ja EBCDIC, mutta oli ilmeistä, etteivät ne kyenneet käsittelemään kaikkia maailman eri merkkejä ja aakkosia. |
| The solution to this problem was to create a set of "wide" 16-bit characters that would theoretically be able to accommodate most international language characters. |
Ratkaisuna tähän ongelmaan kehitettiin 16-bittisten "leveiden" merkkien merkistö, jolla voitaisiin teoreettisesti esittää suurin osa kansainvälisistä kielellisistä merkeistä. |
| This new charset was first known as the Universal Character Set (UCS), and later standardized as Unicode. |
Tätä merkistöä kutsuttiin ensin nimellä Universal Character Set eli UCS, ja myöhemmin se standardoitiin Unicodeksi. |
| However, after the first versions of the Unicode standard it became clear that 65,535 (216) characters would still not be enough to represent every character from all scripts in existence, so the standard was amended to add sixteen supplementary planes of 65,536 characters each, thus bringing the total number of representable code points to 1,114,112. |
Ensimmäisten Unicode-standardien jälkeen kävi kuitenkin ilmeiseksi, että 65 535 (216) merkkiä ei vieläkään olisi tarpeeksi kaikkien olemassa olevien kirjoitusjärjestelmien merkkien esittämiseen, joten standardiin lisättiin 65 536 merkin lisätasoja yhteensä 16 kappaletta, jolloin esitettävien merkkien määrä nousi 1 114 112:een. |
| To this date, less than 10% of that space is in use. |
Nykyisin alle 10 % tästä merkkiavaruudesta on käytössä. |