Nội dung toàn văn Tiêu chuẩn quốc gia TCVN 5773:1993 về Công nghệ thông tin – Bộ mã chuẩn 16 Bit chữ nôm dùng trong trao đổi thông tin
TIÊU CHUẨN VIỆT NAM
TCVN 5773:1993
CÔNG NGHỆ THÔNG TIN – BỘ MÃ CHUẨN 16 BIT CHỮ NÔM DÙNG TRONG TRAO ĐỔI THÔNG TIN
Information technology – Nom 16-bit standard coded set for information interchange
Lời nói đầu
TCVN 5773 – 1993 được xây dựng phù hợp với tiêu chuẩn quốc tế ISO /IEC6478 – 1990.
TCVN 5773 – 1993 do Tiểu ban mã chuẩn chữ Nôm thuộc Ban kỹ thuật Công nghệ thông tin biên soạn, Tổng cục Tiêu chuẩn – Đo lường – Chất lượng đề nghị và được Bộ Khoa học, Công nghệ và Môi trường ban hành theo Quyết định số 1847/QĐ ngày 31 tháng 12 năm 1993.
CÔNG NGHỆ THÔNG TIN – BỘ MÃ CHUẨN 16 BIT CHỮ NÔM DÙNG TRONG TRAO ĐỔI THÔNG TIN
Information technology – Nom 16-bit standard coded set for information interchange
1. Phạm vi
Tiêu chuẩn này quy định bộ mã chuẩn chữ Nôm Việt (sau đây gọi tắt là chữ Nôm) dùng trong xử lý và trao đổi thông tin tự động. Nó được dùng cho việc biểu diễn, truyền thông, trao đổi, xử lý, ghi nhớ, đưa vào và thể hiện các thông tin viết bằng chữ Nôm. Mọi chữ Nôm được trình bày trong tiêu chuẩn này đều được thừa nhận là chữ đã được dân tộc Việt Nam sử dụng và là tài sản văn hóa cổ của quốc gia Việt Nam.
Tiêu chuẩn này xác định cấu trúc tổng thể bộ mã chuẩn chữ Nôm và
– định nghĩa các thuật ngữ được dùng
– mô tả cấu trúc tổng quát của bộ mã chuẩn chữ Nôm
– xác định các hình chữ Nôm và cách viết tương ứng trong chữ quốc ngữ.
2. Tính tuân thủ
Mọi bộ mã chữ Nôm được xem là tuân thủ tiêu chuẩn này nếu nó chứa các chữ Nôm có hình dáng được xác định như trong tiêu chuẩn này và có mã được quy định như trong tiêu chuẩn này.
3. Đặc trưng chữ Nôm
3.1. Cấu tạo chữ Nôm
Chữ Nôm bao gồm các chữ Hán được dùng cho tiếng Việt và các chữ Nôm thuần Việt viết theo thể thức chữ Hán. Trong một văn bản chữ Nôm, thường có mặt hai loại chữ này.
3.1.1. Chữ Nôm có hình chữ như chữ Hán, chủ yếu bao gồm các loại sau:
a/ Mượn nguyên hình và nghĩa chữ Hán, đọc theo các cách khác nhau: âm Hán Việt, âm Việt hóa, âm thuần Việt,
b/ Mượn hình chữ Hán nhưng không lấy nghĩa chữ Hán, đọc theo: âm Hán Việt hoặc cách đọc trại,
c/ Hình chữ ngẫu nhiên trùng với hình chữ Hán, song âm và nghĩa là thuần Việt
3.1.2. Chữ Nôm thuần Việt có hình chữ không trùng với chữ Hán, chủ yếu bao gồm các loại:
d/ Mượn Chữ Hán và cải biên hình chữ (viết tắt, thêm bớt nét…) để biểu thị âm và nghĩa tiếng Việt,
e/ Mượn chữ Hán và ghi thêm dấu phụ đề biểu thị âm và nghĩa tiếng Việt.
f/ Mượn chữ Hán, ghép thêm các thành tố biểu âm hoặc biểu nghĩa tiếng Việt.
g/ Ghép hai chữ Nôm đã có thành một chữ Nôm khác,
h/ Ghép một chữ Nôm với một thành tố chữ Hán để tạo một chữ Nôm khác.
3.2. Quan hệ hình và âm chữ Nôm
Trong các văn bản chữ Nôm, một hình chữ Nôm có thể được đọc theo nhiều âm khác nhau và ngược lại, một âm đọc có thể được ghi thành nhiều hình chữ khác nhau.
4. Trật tự chữ Nôm
Trật tự chữ Nôm trình bày trong tiêu chuẩn này được lấy theo quy định của ISO 10646.1:1993 (Bảng 1).
Ngoài ra, trong tiêu chuẩn này, các chữ Nôm còn được sắp theo trật tự của chữ quốc ngữ (quy định theo TCVN 5712:1993) tương ứng với một âm đọc tiêu biểu của chữ Nôm đã cho (Bảng 2).
5. Các định nghĩa
5.1. Tổ hợp bit; bai: tập sắp thứ tự các bít biểu diễn một ký tự hay một phần của một ký tự. Trong tiêu chuẩn này giá trị bai được biểu diễn theo ký pháp hệ mười sáu từ 00 đến FF.
5.2. Ký tự: thành viên của một tập các phần tử được dùng để tổ chức, điều khiển hay biểu diễn dữ liệu.
5.3. Ký tự không tổ hợp: thành viên của tập các chữ Nôm (trừ dấu cá và dấu nháy).
5.4. Ký tự tổ hợp: dấu cá và dấu nháy dùng để tổ hợp với một ký tự không tổ hợp đứng trước nó nhằm tạo ra ký tự mới.
5.5. Ký tự hình chữ: một ký tự, không giữ chức năng điều khiển, có dạng biểu diễn thấy được thông qua cách viết tay, in hay hiển thị.
5.6. Ký hiệu hình chữ: dạng biểu diễn thấy được của một ký tự hình chữ.
5.7. Ký tự hợp thành: một ký tự hình chữ có ký hiệu hình chữ được tạo ra bằng cách tổ hợp các ký hiệu hình chữ của một ký tự hình chữ khác với ký hiệu hình chữ của ký tự tổ hợp. Biểu diễn mã của một ký tự hợp thành bao gồm biểu diễn mã của ký tự hình chữ cùng với biểu diễn mã của một ký tự tổ hợp.
5.8. Ký tự dựng sẵn: một ký tự hình chữ không hợp thành.
5.9. Bộ ký tự mã hóa: tập các quy tắc rõ ràng thiết lập ra một bộ ký tự và mối quan hệ một-một giữa mỗi ký tự của bộ này với biểu diễn mã của nó.
5.10. Bảng mã: Bảng trình bày ký tự được gắn với mỗi tổ hợp bit trong một cách mã.
5.11. Chức năng điều khiển: một tác động điều khiển việc ghi chép, xử lí, truyền hay thông dịch dữ liệu và có biểu diễn mã là một hay nhiều tổ hợp bit.
5.12. Điểm mã: một giá trị số viết theo hệ 16 biểu thị mã hóa cho một chữ Nôm.
5.13. Chữ Nôm: Chữ Nôm là một tập hợp các ký hiệu hình bố trí trong ô vuông diễn tả cho các hình tiết tiếng Việt, biểu diễn dựa trên cơ sở cách viết chữ Hán và các bộ trong chữ Hán có cải biên.
5.14. Chữ Nôm thuần Việt: chữ Nôm do người Việt Nam tạo nên, có hình dáng biểu diễn không trùng với bất kỳ chữ Hán nào.
5.15. U +: Ký hiệu cho điểm mã đã được quy định trong ISO 10646-1:1993.
5.16. V+: Ký hiệu cho điểm mã được quy định cho chữ Nôm thuần Việt.
6. Bộ mã chuẩn chữ Nôm
Bộ mã chuẩn chữ Nôm bao gồm các mã từ 4E00 – 9FE5 của ISO 10346.1:1993 và các mã từ A000 trở đi của bảng này.
Kèm theo bộ mã này là bảng tương ứng giữa chữ Nôm với cách viết theo chứ Quốc ngữ, được sắp theo trật tự của chữ quốc ngữ tương ứng với một âm đọc tiêu biểu của chữ Nôm đã cho.
FILE ĐƯỢC ĐÍNH KÈM THEO VĂN BẢN
|