Uluslararasılaştırma
2 UNICODE
UNICODE, Unicode Consortium organizasyonu tarafından geliştirilen
ve her karaktere bir sayı değeri karşılığı atayan bir standarttır.
Evrensel Karakter Seti (UCS) olarak bilinen ISO/IEC 10646 standardı
ise, her iki organizasyonun işbirliği ile aynı sayısal karşılıkları
taşımaktadır. Bu set,
-
Yeryüzündeki tüm karakterlere bir sayı değeri atamayı amaçlamaktadır.
- Zaman içinde yeni karakterler eklenebilir ama eski karakterlerin sayı
değerleri aynı kalır.
- Sayı değerleri UCS-4 adlı 31 bitlik set üzerinden verilir. İlk 7 bit
'Group', sonraki 8 bit 'Plane', sonraki 8 bit 'Row', en son 8 bit
'Cell' olarak gruplanır. İlk 'Plane' (group = 0, plane = 0) Basic
Multilingual Plane (BMP) olarak adlandırılır. BMP, UCS-2 adı verilen
16 bitlik sete karşılık gelmektedir.
- UCS üzerindeki karakter kod noktaları genellikle u+0a31 biçiminde
onaltılık sistemde sayılar olarak gösterilir.
- u+0021 -- u+007e arasındaki kodlar ASCII ile, u+00a0
-- u+00ff arasındaki kodlar ISO 8859-9 ile aynı tutulmuştur.
Unicode kodlarından oluşan karakter dizilerini (metinleri) bilgisayarda
verimli bir biçimde saklayabilmek amacıyla çeşitli karakter kodlamaları
(encoding) geliştirilmiştir.