|
甚麼是 ISO 10646 國際編碼標準
為提供一個共通的技術基礎以處理不同語文的電子資料,國際標準化組織 (ISO)
發展了一套名為 ISO 10646 的國際編碼標準。該標準為世界各種主要語文的字符包括繁體及簡體的中文字,編訂統一的內碼。
各
種語文的字符各有不同。為了在電腦及電子裝置內處理各地區本身的字符,世界各地採用了不同的編碼標準。例如香港採用 ISO 10646
國際編碼標準及「大五碼」,並正積極推廣應用 ISO 10646
國際編碼標準。內地採用的中文編碼標準是「國標碼」。台灣的中文編碼標準則是「中文標準交換碼」,但普遍使用「大五碼」。各種不同的編碼標準互不兼容,一
個編碼在不同的編碼標準內可能代表不同的字符,導致某一地區發出的電子資訊,在傳送到其他地區的電腦系統時,可能會出現亂碼或某些字符不能正確地顯示等問
題。即使可使用轉換編碼的軟件以顯示不同編碼的資料,但這不單費時失事,更未必能完全解決問題。
制
訂 ISO 10646 國際編碼標準的目的,便是為了解決上述問題。該編碼標準涵蓋了各種主要語文的字符,包括繁體及簡體的中文字。ISO
10646
國際編碼標準提供了一套統一的字符編碼標準,方便各地的電腦用戶進行電子通訊及資料交換。採用該標準後,世界各地不同的電腦系統之間便能更準確地儲存、處
理、傳遞及顯示各種語文的電子資訊,從而加強各地間電子資訊的流通及推動電子交易的進行。
ISO 10646 國際編碼標準的發展情況
國際標準化組織於一九九三年發表
ISO 10646 國際編碼標準的首個版本,全名是「ISO/IEC 10646-1:1993」,並在二零零零年發表了「ISO/IEC
10646-1:2000」。「ISO/IEC 10646-1:2000」是「ISO/IEC 10646-1:1993」的更新版本,它包括了「ISO/IEC
10646-1:1993」內的 20,902 個表意文字及新增收於擴展區 A 的 6,582 個表意文字,即共
27,484 個表意文字。國際標準化組織在二零零一年十一月發表了「ISO/IEC 10646-2:2001」,作為對「ISO/IEC
10646-1:2000」的補充。「ISO/IEC 10646-2:2001」於 擴展區
B
新增了 42,711 個表意文字,使 ISO 10646 國際編碼標準所包括的表意文字總數超逾 70,000
個,其中包括所有收錄在《康熙字典》、《漢語大字典》和《漢語大詞典》內的漢字。國際標準化組織於二零零四年四月發表了「ISO/IEC
10646:2003」。「ISO/IEC 10646:2003」合併了「ISO/IEC
10646-1:2000」和它的補充版本「ISO/IEC 10646-2:2001」而成為一個單一發行本。因此,「ISO/IEC
10646:2003」內的表意文字與「ISO/IEC 10646-1:2000」附帶「ISO/IEC
10646-2:2001」內的表意文字是相同的。國際標準化組織在二零零八年十二月發表了「ISO/IEC
10646:2003」的第五修訂版。「ISO/IEC 10646:2003」的第五修訂版於擴展區 C
增加了4,149個表意文字。國際標準化組織在二零零九年十月發表了「ISO/IEC 10646:2003」的第六修訂版。
二零零五年十一月國際標準化組織公布的「ISO/IEC 10646:2003 第一修訂版」,發表一個名為 International Ideographs Core(IICORE) 的表意文字子集。
表意文字是指一些字形與字義具有關係的文字,例如漢字。把表意文字收納在 ISO 10646 國際編碼標準的工作是分三期進行的,即擴展區 A、擴展區 B 及擴展區 C 等三個階段。擴展區 A、擴展區 B 及擴展區 C 已分別隨「ISO/IEC
10646-1:2000」、「ISO/IEC 10646-2:2001」及「ISO/IEC 10646:2003」的第五修訂版獲得發表。
為達到標準化的目的,國際標準化組織在以下網頁免費提供一些刊載 ISO 標準的文件(包括 ISO 10646 國際編碼標準及其修訂版):
http://standards.iso.org/ittf/PubliclyAvailableStandards/ 。
國際標準化組織及 Unicode 學術學會維持 ISO 10646 國際編碼標準及統一碼的同步發展。有關
ISO 10646 國際編碼標準 / 統一碼的收字資料,請參閱 Unicode 學術學會的網頁 http://www.unicode.org/。
|