对人类最大的贡献-台大电机系计算机中心.DOC

对人类最大的贡献-台大电机系计算机中心.DOC

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对人类最大的贡献-台大电机系计算机中心

對人類最大的貢獻 我自認為有三項: 萬國碼(Unicode)之編碼架構的創始者 高速公路電子收費(ETC)計程收費方案之創始人 中文電腦輸入法輸入表之原創人 中文電腦字型輾轉輸出法產生技術發明人 現在讓我一項一項的來說明: 萬國碼(Unicode)之編碼架構之創始人 民國65年(1976)至70年(1981)間,本人在交部部國際電信局主持國際公眾電報自動處理系統時,由於使用單位要求國際來報要能自動印出中文收報人地址,因而發明了一套中文電腦系統,在輸入法及輸出法方面有三個專利,而在中文內碼或交換碼方面也發明了一種「先筆劃後部首不避開控制碼」的編碼方式,受到行政院主計處電子處理資料中心(EDP Center of Executive Yuan)的賞識,該中心的顧問團一致贊同採用本人的編碼方式做為該中心正要編定之中文內碼標準。 本人所創始的編碼方式的特點是: 每一中文字使用2個位元組(Bytes); 每一個位元組不避開ASCII(American Standard Code for Informatin Interchange)的控制碼;即00~FF全部使用,不避開00~1F, 7F, 80~9F, FF 等控制碼; 中文的字序採「筆劃序」而同筆劃的再按部首的次序;也就是「先筆劃後部首」之字序; 第一次編碼採「跳號編碼」即先編奇數碼,而偶數碼留為第二次以後擴充之用; 在字碼的前面編定中文模式全形之「控制碼、特殊符號、阿拉伯數字、英文大寫及小寫、注音符號、日文片假名及平假名、及數學及繪圖符號等特殊符號」。 行政院主計處電子處理資料中心根據以上之編碼原則在民國70年2月印就「中文資訊交換標準碼」(Chinese Information Interchange Standard Codes, CIISC) (初稿),寄送全國各單位試用。附本編碼之前言及某些內頁取樣。 不料,在本碼公佈之後,受到另一派以交大謝清俊教授為首的「國字整理小組」等人的異議,此一小組所持之主要意見認為行政院主計處所編之碼,沒有依照ISO 2022的規定每一位元組必須避開ASCII的控制碼,該小組之編碼方式之特點是: 每一中文字使用3個位元組; 每一位元組必須避開ASCII控制碼; 中文之字序係採字典的字序,即「先部首後筆畫」; 編定常用字、次常用字、罕用字、異體字、簡體字、古字、及死字等。 而該小組幕後的支持者是當時的政務委員李國鼎先生及文建會。而這中文編碼這樣基礎性的工作在國內竟然鬧了雙包,於是上層授意當時國科會副主任委員兼資訊工業策進會執行長何宜慈博士出面協調,開了一次歷史性的「溪頭會議」,由全國資訊有關的學者專家約四五十人浩浩蕩蕩地到溪頭聽兩造報告他們的編碼方式及特點,會後由何副主委做結論,重新編定國家標準碼: 每一中文字採用2個位元組; 每一位元組必須依照ISO 2022之規定避開ASCII之控制碼; 字序按照常用字及次常用及罕用等學分段編排,每段按字典之次序; 於是行政院主計處重新依照溪頭會議之結論編定另一碼,由何副主委命名為「通用漢字標準交換碼」,而捨棄原先編定之主計碼(初稿)。後來這重編之「通用漢字標準交換碼」在中央標準局之標準委員會中通過為國家標準CNS 11643. 而這被捨棄之主計碼(初稿)架構在十年後1991竟然被萬國碼協會(Unicode Consortium)視為珍品,採用為全世界的編碼標準,而組成這萬國碼協會者都是赫赫有名之電腦及資訊大廠商,如IBM, Microsoft, HP, Apple, 等,將此Unicode編碼標準製作在他們各式的電腦及資訊產品之中,舉例言之,現今Microsoft Word中所使用之中文碼(稱為中日韓表意文字)即是Unicode,其編碼方式如下: 其基本運作面(Basic Manipulation Plan, BMP)為每一中文字2個位元組;但可擴充至4個位元組; 每一位元組不避開ASCII控制碼;即00~FF均可使用; 中文字序是按字典的次序,先部首後筆劃。 根據本人的研究,Unicode 的編碼架構及某些特殊符號之編碼有與主計碼(初稿)雷同之處: 每一中文字採2個位元組; 每一位元組不避開ASCII控制碼;即 00~FF 均可使用; 下列特殊符號之編碼完全相同: space ! “ # $ % ‘ ( ) * + , - . / 之編碼為 0020, 0021, 0022, 0023, 0024, …., 002F 0 1 2 3 4 5 6 7 8 9 : ; = ? 之編碼為 0030, 0031, 0032, 0033, 0034, …, 003F @ A B C D E F G H I J K L M

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档