Uluslararasılaştırma

2  UNICODE

UNICODE, Unicode Consortium organizasyonu tarafından geliştirilen ve her karaktere bir sayı değeri karşılığı atayan bir standarttır. Evrensel Karakter Seti (UCS) olarak bilinen ISO/IEC 10646 standardı ise, her iki organizasyonun işbirliği ile aynı sayısal karşılıkları taşımaktadır. Bu set,
  • Yeryüzündeki tüm karakterlere bir sayı değeri atamayı amaçlamaktadır.
  • Zaman içinde yeni karakterler eklenebilir ama eski karakterlerin sayı değerleri aynı kalır.
  • Sayı değerleri UCS-4 adlı 31 bitlik set üzerinden verilir. İlk 7 bit 'Group', sonraki 8 bit 'Plane', sonraki 8 bit 'Row', en son 8 bit 'Cell' olarak gruplanır. İlk 'Plane' (group = 0, plane = 0) Basic Multilingual Plane (BMP) olarak adlandırılır. BMP, UCS-2 adı verilen 16 bitlik sete karşılık gelmektedir.
  • UCS üzerindeki karakter kod noktaları genellikle u+0a31 biçiminde onaltılık sistemde sayılar olarak gösterilir.
  • u+0021 -- u+007e arasındaki kodlar ASCII ile, u+00a0 -- u+00ff arasındaki kodlar ISO 8859-9 ile aynı tutulmuştur.
Unicode kodlarından oluşan karakter dizilerini (metinleri) bilgisayarda verimli bir biçimde saklayabilmek amacıyla çeşitli karakter kodlamaları (encoding) geliştirilmiştir.

Bu web sitesinde bulunan bilgi ve belgelerin, kaynak gösterilmek koşulu ile kullanılması serbesttir.
Pardus markası ve logotipi TÜBİTAK'ın tescilli markasıdır. Kullanım koşulları için Yasal Uyarı bölümünü inceleyiniz.
Pardus hakkında merak ettikleriniz için lütfen yardım sayfasına başvurun. TÜBİTAK - UEKAE, PK.74 41470, Gebze / Kocaeli.

Copyright 2007 Ulusal Elektronik ve Kriptoloji Araştırma Enstitüsü. Tüm Hakkı Saklıdır. Görüşleriniz