Uluslararasılaştırma

2  UNICODE

UNICODE, Unicode Consortium organizasyonu tarafından geliştirilen ve her karaktere bir sayı değeri karşılığı atayan bir standarttır. Evrensel Karakter Seti (UCS) olarak bilinen ISO/IEC 10646 standardı ise, her iki organizasyonun işbirliği ile aynı sayısal karşılıkları taşımaktadır. Bu set,
  • Yeryüzündeki tüm karakterlere bir sayı değeri atamayı amaçlamaktadır.
  • Zaman içinde yeni karakterler eklenebilir ama eski karakterlerin sayı değerleri aynı kalır.
  • Sayı değerleri UCS-4 adlı 31 bitlik set üzerinden verilir. İlk 7 bit 'Group', sonraki 8 bit 'Plane', sonraki 8 bit 'Row', en son 8 bit 'Cell' olarak gruplanır. İlk 'Plane' (group = 0, plane = 0) Basic Multilingual Plane (BMP) olarak adlandırılır. BMP, UCS-2 adı verilen 16 bitlik sete karşılık gelmektedir.
  • UCS üzerindeki karakter kod noktaları genellikle u+0a31 biçiminde onaltılık sistemde sayılar olarak gösterilir.
  • u+0021 -- u+007e arasındaki kodlar ASCII ile, u+00a0 -- u+00ff arasındaki kodlar ISO 8859-9 ile aynı tutulmuştur.
Unicode kodlarından oluşan karakter dizilerini (metinleri) bilgisayarda verimli bir biçimde saklayabilmek amacıyla çeşitli karakter kodlamaları (encoding) geliştirilmiştir.

Information and documents on Pardus web pages can be used freely anywhere with original source credit.
For information and suggestion(s) please write to info_at_pardus.org.tr
TÜBİTAK - UEKAE, PK.74 41470, Gebze / Kocaeli.