Sunday, February 13, 2005

Chữ Nôm - hiển thị

Chữ Nôm được phân bố rải rác trên nhiều vùng khác nhau của bảng mã Unicode:

1. vùng “CJK Unified Ideographs” [HAN NOM A] {U+4E00~U+9FAF} :
喃, 媄, 吒, 茹, 渃, 焒, 払,...

2. vùng “Private Use area”(+) (HAN NOM A) {U+E000~U+F8FF} :
, , ,...

3. vùng “CJK Compatibility Ideographs” [HAN NOM A] {U+F900~U+FAFF} :
﨤,...

4. vùng “CJK Unified Ideographs extension A” (HAN NOM A) {U+3400~U+4DBF} :
㐌, 䏾, 㗂,...

5. vùng “CJK Unified Ideographs extension B”(*) (HAN NOM B) {U+20000~U+2A6DF} :
𡦂, 𠊛, 𨑗, 𨑜, 𨴦, 𩄲, 𪀄, 𠮿,...

(+): vùng “Private Use area”bao gồm những chữ Nôm mới được đặt "tạm" vào đây, nên mã chữ của tất cả các chữ Nôm trong vùng này đều do nhà thiết kế font "CHU NOM A" quy đinh, không phải là mã Unicode !

(*): vùng “CJK Unified Ideographs extension B”bao gồm những chữ có mã lớn hơn U+FFFF, tức là nằm ngoài bảng Unicode 16bit, nên biểu diễn 16bit của nó(UTF16 chẳng hạn) sẽ có dạng "từ ghép" (surrogate pair):
<high surrogate>+<low surrogate>
*1. vùng “High Surrogates”: {U+D800~U+DBFF}
*2. vùng “Low Surrogates”: {U+DC00~U+DFFF}

Test khả năng hiển thị của trình duyệt:

1. Không định nghĩa font:

𡦂喃
��喃

2. Có định nghĩa font:

𡦂喃
��喃

No comments: