常見問題

有關 ISO/IEC 10646 國際編碼標準的問題及解答
問 1. 什麼是編碼標準?
問 2. 各地使用什麼中文編碼標準?
問 3. 統一的編碼標準有什麼好處?
問 4. 統一的編碼標準對發展共通的中文界面有什麼幫助?
問 5. 什麼是國際標準化組織?
問 6. 什麼是 ISO/IEC 10646 國際編碼標準?
問 7. ISO/IEC 10646 國際編碼標準在何時出版?
問 8. ISO/IEC 10646 國際編碼標準現時的發展情況怎樣?
問 9. 什麼是表意文字?
問 10. 什麼是表意文字小組?
問 11. 表意文字小組成員包括哪些國家/地區?
問 12. 什麼是統一碼 (Unicode)?
問 13. Unicode 和 ISO/IEC 10646 國際編碼標準有什麼關係?
問 14. 什麼是 ISO/IEC 10646 擴展區 B,其好處何在?
問 15. 新舊版本的 ISO/IEC 10646 國際編碼標準以及《香港增補字符集》(簡稱"標準")是否兼容?
問 16. 如何瀏覽 ISO/IEC 10646 版本?
問 17. 我的電腦平台支援ISO/IEC 10646國際編碼標準。為什麼一些機構印發的文件/證件上的中文字,字形與我的電腦平台顯示的不盡相同?
問 18. 一些漢字有不同寫法,例如“悦”和“悅”。要支援“悦”這個字形,技術上可否直接把字體軟件內的“悅”修改成“悦”?

有關《香港增補字符集》的問題及解答
問 1. 為什麼要制訂《香港增補字符集》?
問 2. 《香港增補字符集》是在什麼時候制訂的?
問 3. 《香港增補字符集》更新了什麼內容?
問 4. 《香港增補字符集》收納了什麼字?
問 5. 一般市民或機構可以申請將字符加入《香港增補字符集》嗎?
問 6. 《香港增補字符集》的收字原則基本上是怎樣的?
問 7. 增收《香港增補字符集》字符的程序是怎樣?
問 8. 是否所有《香港增補字符集》內的字符都已收納在 ISO/IEC 10646 國際編碼標準之內?
問 9. 《政府通用字庫》與《香港增補字符集》有什麼關係?
問 10. 為什麼《香港增補字符集》收納粵方言甚至粗話用字?
問 11. 為什麼《香港增補字符集》收納字典中找不到的字?
問 12. 從哪裏可以找到《香港增補字符集》的資料?
問 13. 是否還可以取得過往版本的《香港增補字符集》文件?
問 14. 由 2008 年 3 月 31 日起,編配碼位給新增收的《香港增補字符集》字符,將會有什麽改變?


有關 ISO/IEC 10646 國際編碼標準的問題及解答
問 1. 什麼是編碼標準?
答 1. 編碼標準是指一套將電腦內碼編配給不同字符的標準,以使電腦能夠處理及顯示這些字符。
 
top
問 2. 各地使用什麼中文編碼標準?
答 2. 香港採用 ISO/IEC 10646 國際編碼標準及「大五碼」,並正積極推廣應用 ISO/IEC 10646 國際編碼標準。內地採用的中文編碼標準是「國標碼」。台灣的中文編碼標準則是「中文標準交換碼」,但普遍使用「大五碼」。
 
top
問 3. 統一的編碼標準有什麼好處?
答 3. 採用統一編碼,電腦系統可準確地處理及顯示不同語言的電子資料。用戶毋須使用轉換工具來處理不同編碼的電子資料。統一編碼令在進行電子通訊時,資料失誤的情況減少,從而便利各地間的電子通訊。
 
top
問 4. 統一的編碼標準對發展共通的中文界面有什麼幫助?
答 4. 採用統一編碼標準,世界各地的電腦系統能夠以相同的編碼顯示資訊。中國內地、香港、台灣三地的電腦系統亦將可以準確地顯示以繁體字、簡體字及香港特有用字發出的資訊,而不需要使用不同的編碼標準,以免對電子通訊構成障礙。
 
top
問 5. 什麼是國際標準化組織?
答 5. 國際標準化組織(The International Organization for Standardization,簡稱 ISO)(http://www.iso.ch/) 是於 1947 年成立的非政府組織。成員包括來自超過 160 個國家的代表。ISO 成立的目的是發展不同的國際標準,以改善世界各地在不同項目方面(例如貿易、資訊、技術等)的交流。
 
top
問 6. 什麼是 ISO/IEC 10646 國際編碼標準?
答 6. ISO/IEC 10646 是國際標準化組織(ISO)統籌下,發展出來的一套國際編碼標準,把世界各種主要語言所使用的字符,編入單一套通用字集內。
 
top
問 7. ISO/IEC 10646 國際編碼標準在何時出版?
答 7. 國際標準化組織於一九九三年發表 ISO/IEC 10646 國際編碼標準的首個版本,全名是「ISO/IEC 10646-1:1993」。該組織在二零零零年發表了「ISO/IEC 10646-1:2000」,作為「ISO/IEC 10646-1:1993」的更新版。「ISO/IEC 10646-1:2000」收納了 27,484 個表意文字,其中包括 20,902 個在「ISO/IEC 10646-1:1993」內的表意文字及屬於中日韓表意文字區擴展區 A 的 6,582 個新增的表意文字。 在二零零一年十一月發表的「ISO/IEC 10646-2:2001」,是作為對「ISO/IEC 10646-1:2000」的補充。「ISO/IEC 10646-2:2001」收納了屬於中日韓表意文字區擴展區 B 的 42,711 個新增的表意文字,使ISO/IEC 10646 國際編碼標準所包含的表意文字總數超逾 70,000 個,其中包括所有收錄在《康熙字典》、《漢語大字典》和《漢語大詞典》內的漢字。 國際標準化組織於二零零四年四月發表了「ISO/IEC 10646:2003」,它合併了「ISO/IEC 10646-1:2000」和「ISO/IEC 10646-2:2001」而成為一個單一版本。因此,「ISO/IEC 10646:2003」內的表意文字與「ISO/IEC 10646-1:2000」附帶「ISO/IEC 10646-2:2001」內的表意文字是相同的。國際標準化組織在二零零八年十二月發表了「ISO/IEC 10646:2003」的第五修訂版,於中日韓表意文字區擴展區 C 增加了 4,149 個表意文字。國際標準化組織在二零零九年十月發表了「ISO/IEC 10646:2003」的第六修訂版。 國際標準化組織於二零一一年三月發表了「ISO/IEC 10646:2011」。「ISO/IEC 10646:2011」是合併了「ISO/IEC 10646:2003」和它的第一至七修訂版的單一版本。「ISO/IEC 10646:2011」包含早前已公布的中日韓表意文字區的 20,940 個表意文字,中日韓表意文字區擴展區 A 的 6,582 個表意文字,中日韓表意文字區擴展區 B 的 42,711 個表意文字,中日韓表意文字區擴展區 C 的 4,149 個表意文字和新公布中日韓表意文字區擴展區 D 的 222 個表意文字。國際標準化組織在二零一四年九月發表了「ISO/IEC 10646:2014」,當中包括中日韓表意文字區擴展區 E 的 5,762 個表意文字。
 
top
問 8. ISO/IEC 10646 國際編碼標準現時的發展情況怎樣?
答 8. 表意文字是指一些字形與字義具有關係的文字,例如漢字。把表意文字收納在 ISO/IEC 10646 國際編碼標準的工作是分四期進行的,即中日韓表意文字區擴展區A、中日韓表意文字區擴展區 B、中日韓表意文字區擴展區 C 及中日韓表意文字區擴展區 D 等四階段。中日韓表意文字區擴展區 A 收納了 6,582 個表意文字,已隨「ISO/IEC 10646-1:2000」獲得發表。中日韓表意文字區擴展區 B 收納了 42,711 個表意文字,已隨「ISO/IEC 10646-2:2001」獲得發表。中日韓表意文字區擴展區 C 收納了 4,149 個表意文字,已隨「ISO/IEC 10646:2003」的第五修訂版獲得發表。中日韓表意文字區擴展區 D 收納了 222 個表意文字,已隨「ISO/IEC 10646:2011」獲得發表。中日韓表意文字區擴展區 E 的 5,762 個表意文字,已隨「ISO/IEC 10646:2014」獲得發表。
 
top
問 9. 什麼是表意文字?
答 9. 國際標準化組織依照各國的語言特性,將文字分門別類,其中包括表意文字。表意文字是指一些字形與字義有關的文字,例如漢字,主要包括中國內地、香港、台灣、澳門、日本、南韓、北韓、越南、新加坡等地區所使用的漢字。
 
top
問 10. 什麼是表意文字小組?
答 10. 表意文字小組是國際標準化組織轄下一個工作小組,專責發展 ISO/IEC 10646 國際編碼標準內的表意文字。小組至今已發展了「中日韓表意文字區」(CJK Unified Ideographs Block)、擴展區 A(Extension A)、擴展區 B(Extension B)、擴展區 C(Extension C)、擴展區 D(Extension D)及擴展區 E(Extension E)。
 
top
問 11. 表意文字小組成員包括哪些國家/地區?
答 11. 表意文字小組成員來自中國內地、香港、澳門、台北市電腦商業同業公會、新加坡、日本、南韓、北韓、越南及美國。 此外,Unicode Consortium 亦有代表參加該小組的會議,協調 ISO/IEC 10646 國際編碼標準及統一碼之間的同步發展工作。
 
top
問 12. 什麼是統一碼 (Unicode)?
答 12. 統一碼是由一個名為 Unicode Consortium 的機構制訂的字符編碼系統,以支援現今世界各種不同語言的書面文本的交換、處理及顯示。Unicode Consortium 的成員大部分為電腦軟硬件的供應商。
 
top
問 13. Unicode 和 ISO/IEC 10646 國際編碼標準有什麼關係?
答 13. 在一九九一年,國際標準化組織與 Unicode Consortium 決定共同制訂一套適用於多種語文文本的通用編碼標準。自此以後,該兩個組織便一直緊密合作,同步發展 ISO/IEC 10646 國際編碼標準及統一碼。國際標準化組織提供 ISO/IEC 10646 國際編碼標準內的字符及編碼資料,Unicode Consortium 則對這些字符及編碼資料提出應用的方法以及語義資料作補充。ISO/IEC 10646 國際編碼標準與相應版本的統一碼所包含的字符及使用的編碼是相同的。統一碼可被視為是 ISO/IEC 10646 國際編碼標準的實踐版。因此,支援統一碼的產品,亦即支援 ISO/IEC 10646 國際編碼標準。
 
top
問 14. 什麼是 ISO/IEC 10646 擴展區 B,其好處何在?
答 14.

三十二位元碼位是由一對特殊值的十六位元碼位所組成,即所謂的代理對(surrogate pair)。這一對代理,分別是前導代理 (lead surrogates)和後尾代理 (trail surrogates) 。前導代理(lead surrogates) 的範圍值是從D800到DBFF,後尾代理(trail surrogates) 的範圍值是從DC00至DFFF。只要使用統一碼標準中特定的算法(http://unicode.org/faq/utf_bom.html#utf16-2),就可以通過代理對的數學運算,得出該字符的三十二位元碼位。

統一碼最初的設計是使用十六位元碼位,為大約65,000個字符編碼。經過多年的發展,十六位元碼位已不足夠代表常見的文字。採用三十二位元碼位擴展編碼至一百萬個字符,足夠為常見的文字編碼。

採用三十二位元碼位,能更有效和準確地使用通用的中文字符進行日常電子通訊,因為三十二位元碼位 (中日韓表意文字擴展區 B 及其後的擴展區) 不但具備中日韓表意文字區、 中日韓表意文字擴展區 A 內的表意文字,更吸納了各界採用的通用中文字符,令表意文字總數超過70,000 個,當中包含了收錄在《康熙字典》、《漢語大字典》和《漢語大詞典》內的漢字。

top
問 15. 新舊版本的 ISO/IEC 10646 國際編碼標準以及《香港增補字符集》(簡稱"標準")是否兼容?
答 15.

新版本"標準"是兼容舊版本的。但在軟件實施方面,支援舊版本"標準"的操作系統,不一定能夠正確顯示根據新版本"標準"增收的字符。另一方面,現有支援舊版本"標準"的應用軟件,也不一定能夠正確處理新版本"標準"所增收的字符,包括在新版本"標準"中獲國際標準化組織編配碼位的《香港增補字符集》字符。

用戶使用"香港政府一站通"網上服務時,如果遇到有關處理字符的問題,可以瀏覽和參考網頁上的常見問題欄目。

top
問 16. 如何瀏覽 ISO/IEC 10646 版本?
答 16.

本中文網站的 ISO/IEC 10646 版本是以 UTF-8 編碼的。普遍通用的網頁瀏覽器如 Microsoft Internet Explorer 及 Mozilla Firefox 均已支援 UTF-8 編碼。請參照以下步驟以瀏覽本網站的 ISO/IEC 10646 版本:

1. 設定你的互聯網瀏覽器以中文字型顯示 UTF-8 網頁,或安裝適用於你的互聯網瀏覽器的中文顯示支援。
2. 當你瀏覽 UTF-8 網頁時,把互聯網瀏覽器的編碼選項轉成 "UTF-8" 。

top
問 17. 我的電腦平台支援ISO/IEC 10646國際編碼標準。為什麼一些機構印發的文件/證件上的中文字,字形與我的電腦平台顯示的不盡相同?
答 17.

ISO/IEC 10646國際編碼標準提供一套統一的字符編碼標準,方便各地電腦用戶進行電子通訊及資料交換。這些字符編碼在個別電腦平台的顯示字形或列印字形,取決於應用軟件選用的字體。

ISO/IEC 10646國際編碼標準轄下的表意文字小組根據中日韓表意文字的等同程序和安排(ISO/IEC 10646國際編碼標準文件附件S:Procedure for the unification and arrangement of CJK Ideographs),審議不同字符來源的字形是否等同,並為等同的字形編配同一編碼。換言之,同一編碼可以代表一個或多個字形。下表以示例形式,列舉同一編碼的字符使用不同字體所顯示的等同字形。

1. 新細明體、Meiryo (日本字體)和Batang (韓國字體) 是Windows 7隨機安裝的字體。
2. 各等同字形的主要差異以藍色圈示。
由於列印有關文件/證件的電腦系統或設備的預設字體,可能與你個人電腦的預設字體不同,所以當中一些中文字字形,或會與你個人電腦平台顯示的不盡相同。

關於如何找出中文字的ISO/IEC 10646編碼,請參考以下短片示範: https://www.youtube.com/watch?v=WEvJqfUZwcE

ISO/IEC 10646國際編碼標準可在http://standards.iso.org/ittf/PubliclyAvailableStandards/ 下載。該文件提供更多字符來源和等同字形的資料,有助確定一些近似的字形是否等同。

top
問 18. 一些漢字有不同寫法,例如“悦”和“悅”。要支援“悦”這個字形,技術上可否直接把字體軟件內的“悅”修改成“悦”?
答 18.

漢字往往一字多形,但某些字卻不能直接修改字形,因為這些漢字在ISO/IEC 10646國際編碼標準中獲分配不同碼位,若修改其中一個碼位的字形,兩個碼位或會出現相同的字形。以“悦”和“悅”為例,兩字在ISO/IEC 10646國際編碼標準中獲分別編碼為U+60A6和U+6085:

開發字體軟件的人士要支援“悦”這個字形,應以ISO/IEC 10646編碼U+60A6 為基礎,而不應修改U+6085“悅”的字形,否則U+60A6和U+6085兩個碼位便會出現相同字形,造成混亂,不利於電子資訊交換。

如欲查看其他相關例子,請參閱ISO/IEC 10646國際編碼標準文件附件S,該文件可在http://standards.iso.org/ittf/PubliclyAvailableStandards/ 下載。

top



有關《香港增補字符集》的問題及解答
問 1. 為什麼要制訂《香港增補字符集》?
答 1.

政府"數碼21"資訊科技策略下的其中一項措施,是為香港特區制訂一套開放和共通的中文界面,方便使用者選擇用中文進行電子通訊。這項措施的重點,是採用 ISO/IEC 10646 國際編碼標準和《香港增補字符集》,以解決編碼標準不統一和字數不足的問題。

市面上流行的操作系統、數據庫軟件、辦公室自動化軟件、網頁瀏覽器、電子郵件程式以及輸入工具,均已廣泛地採納了 ISO/IEC 10646 國際編碼標準。隨著《香港增補字符集》被納入 ISO/IEC 10646 國際編碼標準內,電腦用戶若採用符合 ISO/IEC 10646 國際編碼標準的產品,將可在電腦上使用《香港增補字符集》的字符。

top
問 2. 《香港增補字符集》是在什麼時候制訂的?
答 2. 一九九九年九月,香港特區政府與「中文界面諮詢委員會」合作,制訂及公布《香港增補字符集》。政府於二零零一年十二月公布《香港增補字符集-2001》、於二零零五年五月公布《香港增補字符集-2004》、並於二零零九年十二月公布《香港增補字符集-2008》。《香港增補字符集》的最新版本是在二零一七年五月公布的《香港增補字符集-2016》。
 
top
問 3. 《香港增補字符集》更新了什麼內容?
答 3.

《香港增補字符集-2016》增收了 24個字符 以擴充及取代於二零零九年公布的《香港增補字符集-2008》。制訂《香港增補字符集-2016》亦為在技術上配合國際標準化組織「ISO/IEC 10646:2014」第二修訂版。

《香港增補字符集-2008》增收了 68個字符 以擴充及取代於二零零五年公布的《香港增補字符集-2004》。制訂《香港增補字符集-2008》亦為在技術上配合國際標準化組織「ISO/IEC 10646:2003」及其第一至第六修訂版,該版本已收納了《香港增補字符集-2008》全部的字符。《香港增補字符集-2008》內的碼位已作出相應的調整。

《香港增補字符集-2004》增收了 123個字符 以擴充及取代於二零零一年公布的《香港增補字符集-2001》。制訂《香港增補字符集-2004》亦為在技術上配合國際標準化組織分別在二零零四年四月及二零零五年十一月公布的「ISO/IEC 10646:2003」和第一修訂版。「ISO/IEC 10646:2003」及其第一修訂版收納了《香港增補字符集-2004》全部的字符。《香港增補字符集-2004》內的碼位已作出相應的調整。

《香港增補字符集-2001》增收了 116個字符 以擴充及取代於一九九九年公布的《香港增補字符集》。制訂《香港增補字符集-2001》亦為在技術上配合國際標準化組織在二零零一年十一月公布的「ISO/IEC 10646-2:2001」。「ISO/IEC 10646-2:2001」收納了 1,622 個《香港增補字符集》的字符。該等字符在《香港增補字符集-2001》內的碼位已作出相應的調整。

top
問 4. 《香港增補字符集》收納了什麼字?
答 4.

《香港增補字符集》字符的分類:

《香港增補字符集-2016》共收錄 5,033 個字符,當中絕大部分為中文字符(共 4,591 個,佔總數91%)。這些字符大多可在大型字典(包括《康熙字典》 、《漢語大字典》、《漢語大詞典》、《中華字海》)找到。由於每個中文字符都可作不同用途,因此《香港增補字符集-2016》沒有為每個字符作詳細分類。不過,這四千五百多個字符大體上可歸入以下類別︰

    專有名詞用字,如人名、地名、公司名稱

    粵方言用字

    科學名詞用字

    部首或部件

這些字符主要由政府部門(如律政司、稅務局、司法機構、地政總署、香港警務處、入境事務處、公司註冊處)、學術組織、教育機構,以及一般市民建議收錄。
至於餘下的 442 個字符,則屬各類符號,包括漢字部件、漢語拼音字母、國際音標符號、日本平假名和片假名等。

top
問 5. 一般市民或機構可以申請將字符加入《香港增補字符集》嗎?
答 5. 可以。市民、政府部門及其他私人機構均可向「中文界面諮詢委員會」秘書處提交增收字符申請,將字符加入《香港增補字符集》內。提交增收字符申請時,須提交有關字符的字形、讀音及意義,最好能一併提供字符的字源、用途和例句等資料。
 
top
問 6. 《香港增補字符集》的收字原則基本上是怎樣的?
答 6. 《香港增補字符集》的收字的基本原則,是每字須有來歷,並且必須是香港特區政府或市民有需要使用的字符。由於《香港增補字符集》會逐步被納入 ISO/IEC 10646 國際編碼標準內,因此審核收集得來的字符時,須參考ISO/IEC 10646 國際編碼標準的有關規則。
 
top
問 7. 增收《香港增補字符集》字符的程序是怎樣?
答 7. 市民可參閱申請程序及原則
中文界面諮詢委員會審核增收《香港增補字符集》字符的申請。
 
top
問 8. 是否所有《香港增補字符集》內的字符都已收納在 ISO/IEC 10646 國際編碼標準之內?
 
答 8. 「ISO/IEC 10646:2014」第二修訂版收納了《香港增補字符集-2016》全部的字符。
 
top
問 9. 《政府通用字庫》與《香港增補字符集》有什麼關係?
答 9. 一九九五年香港政府為方便各部門以電子方式通訊,建立了一套名為《政府通用字庫》的中文字符集,收錄一些香港特有用字,以補充大五碼字集的不足。一九九九年,香港特區政府與「中文界面諮詢委員會」合作,制訂及公布《香港增補字符集》以取代《政府通用字庫》。政府於二零零一年十二月公布《香港增補字符集-2001》、於二零零五年五月公布《香港增補字符集-2004》,並於二零零九年十二月公布《香港增補字符集-2008》。《香港增補字符集》的最新版本是在二零一七年五月公布的《香港增補字符集-2016》。
 
top
問 10. 為什麼《香港增補字符集》收納粵方言甚至粗話用字?
答 10. 這些字主要由司法機構、香港警務處、律政司、香港語言學學會和香港理工大學提交,部分可在粵語字典或學術著作中找到。《香港增補字符集》收納粵語用字的原因之一,是方便司法機構記錄案件審訊過程,以及方便香港警務處和其他執法機關錄取口供。此外,粵方言研究是一門學科,不少語文學會會員和專上院校師生都以這個課題進行學術研究工作。若字符集不收錄粵方言用字,要刊印有關的論文著述,會有一定困難。
 
top
問 11. 為什麼《香港增補字符集》收納字典中找不到的字?
答 11. 《香港增補字符集》中有一些在字典找不到的字。這些字除了少數是粵方言用字外,大多數來自入境事務處、公司註冊處、稅務局和地政總署的資料庫,並經證實用於現今的人名、公司名和地方名。由於人名、公司名和地方名用字會出現在各類證件、合約和法律文件上,為了應用上的需要和法律上的原因,這些字也須納入《香港增補字符集》內。
 
top
問 12. 從哪裏可以找到《香港增補字符集》的資料?
答 12. 香港特區政府政府資訊科技總監辦公室網站內的中文界面部份 (http://www.ogcio.gov.hk/tc/business/tech_promotion/ccli/),收錄了有關《香港增補字符集》的文件及相關資料。
 
top
問 13. 是否還可以取得過往版本的《香港增補字符集》文件?
答 13. 為方便市民或電腦供應商繼續能查閱過往版本的《香港增補字符集》的技術資料,該等資料仍會存放在政府資訊科技總監辦公室網站上。
 
top
問 14. 由 2008 年 3 月 31 日起,編配碼位給新增收的《香港增補字符集》字符,將會有什麼改變?   
答 14. 由 2008 年 3 月 31 日起,中文界面諮詢委員會只會繼續為《香港增補字符集》新增收的字符提供 ISO/IEC 10646 國際編碼標準編碼。之前已獲編配碼位的《香港增補字符集》字符,一概不受影響,可以繼續使用。不過,用戶應盡可能將應用系統由大五碼編碼逐步過渡至 ISO/IEC 10646 國際編碼。這項決定的目的,是為了進一步向公眾推廣共通中文界面,以便利中文電子通訊。此舉也符合"數碼21"資訊科技策略中採用 ISO/IEC 10646 國際編碼標準和《香港增補字符集》的方向。市民可以到政府資訊科技總監辦公室網站,參閱最新的《香港增補字符集》字符增收原則 PDF