全字庫

 

建置目的:

 

原行政院主計處電子處理資料中心建置「CNS11643中文標準交換碼全字庫」(簡稱全字庫)網站之目的如下:
一、 建設我國的中文電腦應用環境。
二、 解決個人電腦中文字數不足問題:個人電腦(PC)上常用的內碼如BIG-5Unicode碼,其基本中文字集(13,053或2萬餘字)往往不敷使用。全字庫網站建有字型下載機制,在電腦遇有缺字時,可立即經由網際網路下載字型,取代人工造字方式,減省使用者造字時間,亦可使字型、字體整齊、美觀。
三、 解決自造字交換問題:以電腦傳送的文件如電子郵件、公文等如使用到自造字時,因編碼不一而無法正確呈現;CNS11643國家中文標準交換碼(簡稱國標碼)收編字數將達九萬餘字,字數充足,故以國標碼傳輸,是目前解決自造字交換問題的唯一方法;全字庫網站上建有「轉碼工具」,可供使用者進行國標碼與常用中文碼之互轉。
四、 解決機關、企業、團體內部同字不同碼的問題:使用者各自造字或下載字型後,將造成機關、企業內部自造字「同字不同碼」現象,頻增繁複之轉碼工作;全字庫網站上的「全字庫應用工具4.0」建有「造字分享」機制,可供機關或企業內部所有個人電腦安裝相同的自造字,以維護「同字同碼」原則。
五、 協助機關、企業、團體整合及管理個人電腦上的中文字集:為持續維護「同字同碼」原則,機關、企業或團體內必須實施自造字專人轉管作業,原有舊自造字及後續產生的新增字,均由自造字管理人員負責整合,統一編碼、下載或造字;全字庫網站上建有各項管理工具,可供快速、有效整合及管理內部所有自造字。
六、 解決網頁上罕用字顯示問題:網頁上用到罕用字時,瀏覽者將無法看到或正確的呈現;全字庫網站上建有「字型即時顯示」機制,可供使用者以適合的字體、顏色、大小顯示在螢幕上。

 

建置經過:

 

一、 計畫擬訂:為解決個人電腦中文字數不足及資訊交換等問題, 87年12月完成「CNS11643中文標準交換碼全字庫伺服器」建置計畫案。
二、 1.0版全字庫之建置:自88年1月開始,委託財團法人中文數位 化技術推廣金會(簡稱中推會)建置「CNS11643中文標準交換碼全字庫 伺服器」,同年7月21日開放使用。
三、 2.0版全字庫之建置:1.0版全字庫確實解決了存在已久的缺字與轉碼問題,故頗獲各界好評;為使該字庫功能更實用、更方便,89年3月依預訂計畫並參考使用者所提需求,進行系統功能、操作流程與界面之修改,並增加拼音查詢、符號查詢及GBK(簡體字)碼轉換、造字分享等新功能後,「CNS11643中文標準交換碼全字庫2.0」於同年8月開放使用。
四、 3.0版全字庫之建置:89年6月,為使機關、企業、團體能方便有效管理其內部自用中文字,因而開發個人使用之「自用字管理整合工具」及管理者使用之「自造字彙總工具」;為避免楷、明字體混用影響文書之美觀,並製作國標碼第三、四字面楷體向量字型;為解決網頁上自造字顯示問題,並開發「字型即時顯示」機制;此外,為紓解網路壅塞狀況,並開發「全字庫複製」機制,供使用較頻繁的機關安裝內部網路全字庫後,「CNS11643中文標準交換碼全字庫3.0」於90年3月開放使用。
五、 4.0版全字庫之建置:90年6月起,除繼續製作國標碼第五字面楷體字型外,為使WINDOWS 2000及WINDOWS Me系統環境得以使用全字庫,因而擴充系統功能;為使UNICODE與國標碼能完全對應,並建置Unicode 3.0擴編的中文字及日文、台語音、歐元、國字O等符號字型供下載使用,「CNS11643中文標準交換碼全字庫4.0」於91年1月開放使用。
六、 5.0版全字庫之建置:97年6月起,為提供使用者更友善的互動介面,因而進行全字庫網站改版作業;除完成國標碼所有楷體字型外,為使WINDOWS 2000及WINDOWS XP系統環境得以使用全字庫,因而開發出「全字庫軟體包」相關工具;為便利使用者,新增「全文檢索」功能並整合「轉碼閘門」及「新增字申請」兩系統於全字庫網站中,「CNS11643中文標準交換碼全字庫5.0」於98年1月開放使用。
七、 配合行政院組織改造,有關全字庫之維運工作於101年2月6日移撥由行政院研究發展考核委員會辦理。

 

適用對象:

 

一、機關企業團體內自造字管理者及電腦使用者。
二、一般單機使用者。
三、全字庫伺服器管理者。
四、網頁文件設計者。

 

適用環境:

 

一、Windows 95╱98。 
二、Windows ME。
三、Windows NT(須以administrator <系統管理者> 身份登入) 
四、Windows 2000。(須以administrator <系統管理者> 身份登入) 
五、Windows XP。(須以administrator <系統管理者> 身份登入)

 

系統功能:

 

一、 中文碼查詢:5.0版全字庫目前可供查詢的字共87,047個中文字、10,771個拼音文字及894個符號;87,047個中文字,包含全字庫第一至第七字面(48,274個)及第十至十五字面(38,773個),可經由全字庫網站以總筆畫數、注音符號、倉頡碼、拼音、筆順序、部件及複合等方式查詢其注音、部首、筆畫、筆順序、部件、國標碼(CNS)及BIG-5碼(含BIG-5E)、Unicode碼等相關屬性;10,771個拼音文字,則位於全字庫第八及第九字面;894個符號,包含國標碼第一字面原有符號(684個)及新建的台灣方言音、日文平假名╱片假名、歐元、國字O等符號(210個),可經由全字庫網站以符號類別查詢 其國標碼(CNS)及BIG-5碼(含BIG-5E)、Unicode碼等相關屬性。
二、 字型下載:全字庫提供下載國標碼第一至第十五字面八萬餘個中文字、一萬餘個拼音文字、894個符號的字型,可使用總筆畫數、注音符號、倉頡碼、拼音、筆順序、部件及複合等方式查詢後下載其字型及注音、倉頡屬性資料;符號字,可依符號類別查詢後下載其字型。
三、 中文碼轉換:由全字庫下載的字型及注音、倉頡屬性資料,除可安裝於電腦造字區,並將同時自動建立使用者自用的BIG-5自造字碼與國標碼對照表,再使用全字庫所提供的轉碼工具,進行純文字檔中常用內 碼BIG-5、EUC、Unicode、GBK(繁體字)與國標碼的互轉,以達成資訊之正確交換。
四、 共用(相同)造字集安裝:全字庫自2.0版起提供造字分享機制,供機關、企業或團體內部所有個人電腦安裝相同的自造字集,以維護「同字同碼」原則,減少轉碼次數(機關、企業團體外之單機使用者,亦可以使用此機制安裝與他人相同之中文字集)。
五、 機關企業團體自造字集整合及管理:全字庫自3.0版開始提供的自造字集整合的工具,可供機關、企業團體的自造字管理者能順利整合各電腦上 個人原有的自造字,並有效管理新增的自造字。
六、 網頁上自造字顯示:全字庫自3.0版起即提供「字型即時顯示」,可使網頁上用到的自造字,不需下載、安裝字型,即時到全字庫讀取自造字的字型轉換完圖形檔,再依設計者所需字體、顏色、大小顯示於瀏覽者的電腦上。
七、 內部網路複製全字庫:為紓解全字庫網站的壅塞情形,自3.0版起即提供的全字庫複製機制,可供組織較大或使用較頻繁的政府機關於內部網路上安裝全字庫,不需再經網際網路,就可使用所有的全字庫應用工具與機制。
八、 安裝BIG-5E字集:自4.0版起全字庫新增BIG-5E安裝工具,可將原安裝之24x24明體點矩陣字型更換為40x40字型,並提供楷體向量字型功能。
九、 轉碼閘門:提供各種中文內碼與傳輸碼與國家標準交換碼(CNS11643)等之間進行正確之轉碼作業,並以CNS11643為核心,建立符合中文資訊互通規範中所訂之中文對照表規範之各中文碼與國家標準交換碼(CNS11643)的對照表檔案,以提供最合適的轉碼服務。轉碼服務以Web Service(符合SOAP 1.2規格)方式進行,可提供字串轉碼、文字檔線上轉碼與文字檔離線轉碼功能。並提供Web Service呼叫介面,供程式開發者引用本系統之轉碼服務。此外,為協助一般民眾建立個人造字集與國家標準交換碼(CNS11643)之標準對應,以達到資料交換正確性的確保,故提供全字庫軟體包供一般民眾下載(見工具下載頁面)。民眾在使用全字庫軟體包建立個人造字集並申請成為全字庫網站會員後,可透過全字庫的轉碼閘門網頁上傳個人造字集,亦可查詢或下載其他人上傳之造字集,達到造字集分享的目的。
十、 新增字申請:全字庫係為國家標準交換碼(CNS11643)字碼與屬性資料的查閱與資訊運作平台,用以解決國內異質字碼系統內文件與資料交換時所衍生之字碼錯亂與不足等問題,並承辦CNS11643新增字申登業務,使各界字碼資料能依規定程序編納於國家標準中。本中心為提升此業務之流程效率,並充分掌控各流程的進度,能讓各主管機關及時掌握所申請案件之處理現況及意見反映,並發展申登作業所需的各項主管機關原始字碼資料之查詢功能以利作業之進行。

 

計畫參與人員及機構

 

參與專案工作組之單位﹝人員﹞:

 

客服資訊

 

 

前行政院主計處電子處理資料中心歷年參加中文專案研究工作人員

 

一、 「中文表報輸出系統」、「中文資料線上管理系統」、「中文字型線上查詢系統」之研發: 張系國博士、朱四明博士、那福忠顧問、馮學雄、劉勝東、 馮建中、蕭雲龍、陳慧敏、鄭寶則、范治明;楊世雄、謝世民、劉榕烈、張海萍、陳玉芳
二、 中文輸出入設備之研發(自行組裝「中型中文鍵盤」):朱四明博士、蕭雲龍、陳慧敏、鄭寶則、范治明
三、 「第一代中文終端機」、「多微型處理機中文終端機系統」、「中文線上作業系統」之研發:蔡君玖、楊世雄、謝三省、鄭得旺
四、 中文交換碼之研訂
(一) 「中文資訊交換標準碼」初稿:王金土博士、朱澍人、廖照榮、馬朝瑾、陳玉芳 
(二) 「通用漢字標準交換碼」:朱澍人、曾憲澄、林培謙、廖照榮、馬朝瑾、陳玉芳 
(三) BIG-5碼之擴編(BIG5+):裴瑞源、陳玉芳
五、 全字庫網站之建置:潘城武、黃芳川、馬瑪莉、吳欣宜、陳玉芳、余保倫、黃柏盛、周智禾
六、 中文共通平台之建置:潘城武、黃芳川、馬瑪莉、毛昭慈、余保倫、吳欣宜、黃柏盛、周智禾
七、 政府字碼中心匯整工作:李茂基、黃芳川、余保倫、陳作彬、黃柏盛、周智禾

 

協助單位:

 

 

各承辦單位

 

 

官方網址  http://www.cns11643.gov.tw/AIDB/intro.do

 

arrow
arrow

    龍蓮 發表在 痞客邦 留言(0) 人氣()