今年是CERNET建設(shè)30年?;赝麣v史,作為中國首個(gè)互聯(lián)網(wǎng)主干網(wǎng),CERNET不僅見證了中國互聯(lián)網(wǎng)從無到有、從小到大的發(fā)展奇跡,也為高校師生群體提供了創(chuàng)新的舞臺,締造了中國互聯(lián)網(wǎng)歷史上眾多的第一。
中國第一個(gè)電子雜志的誕生
1995年1月12日,中國第一個(gè)電子雜志——《神州學(xué)人》電子版(英文名CHISA,取自China Scholars Abroad)誕生。
△1995年《神州學(xué)人》電子版的主頁
承載與發(fā)布這本電子雜志的平臺是1994年開始建設(shè)的我國首個(gè)覆蓋全國的互聯(lián)網(wǎng)——中國教育和科研計(jì)算機(jī)網(wǎng)CERNET?!耙婚_始,我們就和CERNET結(jié)下了不解之緣。”曾任《神州學(xué)人》副總編輯的許瓏說。
海外學(xué)子的呼聲
創(chuàng)辦于1987年5月的《神州學(xué)人》是一本專門面向我國海外留學(xué)人員的雜志。
“改革開放后,許多中國留學(xué)生奔赴世界各地,但當(dāng)時(shí)的通訊之難,成本之高,現(xiàn)在難以想象。這本雜志像是一個(gè)情感的紐帶,連接著身處全球的中國留學(xué)生們,大家對它有著非常特別的感情。”許瓏回憶。
80年代末,互聯(lián)網(wǎng)在國外大學(xué)首先興起,大學(xué)師生是最早接觸互聯(lián)網(wǎng)的群體?!澳懿荒馨褔鴥?nèi)的信息及時(shí)發(fā)布在網(wǎng)上?”這是當(dāng)時(shí)很多留學(xué)生們的渴望。中央有關(guān)部門得知這樣的期待,于是在1994年10月21日,相關(guān)領(lǐng)導(dǎo)建議由國家教育委員會負(fù)責(zé)辦理此事。國家教委非常重視這項(xiàng)工作,4天之后,就向中央遞交了報(bào)告,指出已開始建立中國教育和科研計(jì)算機(jī)網(wǎng)CERNET,通過CERNET,即可讓國外的留學(xué)生看到國內(nèi)的媒體信息。于是,1995年1月,在中央的指導(dǎo)和國家教委的推動下,《神州學(xué)人》電子版在CERNET上誕生了。
△1995年,時(shí)任國家教委主任朱開軒、副主任韋鈺等視察《神州學(xué)人》電子版
CERNET支撐CHISA的誕生
《神州學(xué)人》電子版CHISA誕生的前夜,1994年初,在當(dāng)時(shí)國家計(jì)劃委員會、教育委員會的領(lǐng)導(dǎo)下,清華大學(xué)吳建平、李星等一批年輕的專家開始牽頭建設(shè)中國第一個(gè)互聯(lián)網(wǎng)主干網(wǎng)——中國教育和科研計(jì)算機(jī)網(wǎng)CERNET。
一個(gè)偶然的機(jī)會,聽說國家教委正在籌辦《神州學(xué)人》電子版CHISA,李星立刻想到,能不能把這本電子刊放到CERNET上?在回國之前,他在國外留學(xué)8年,對《神州學(xué)人》很有感情。正是這樣一種情結(jié),使得李星極力爭取,要把《神州學(xué)人》電子版放在剛剛建成的CERNET上發(fā)布。
這和國家教委的想法不謀而合,可能也正是許瓏提到的“緣分”。當(dāng)時(shí)CERNET的發(fā)起領(lǐng)導(dǎo)之一,也就是主管CERNET工作的國家教委副主任韋鈺,也分管留學(xué)生工作,而韋鈺本人的留學(xué)經(jīng)歷和其“報(bào)效祖國,責(zé)無旁貸”的留學(xué)理念,使得她對留學(xué)生和《神州學(xué)人》也有格外的關(guān)注和厚愛。天時(shí)地利人和,就這樣,《神州學(xué)人》電子版和CERNET相伴而生。
《神州學(xué)人》電子版開辟了中國出版刊物上網(wǎng)的先河。對于這樣的新鮮事物,大家感到非常新奇,也非常包容與支持?!拔覀?nèi)マk理《神州學(xué)人》電子版出版手續(xù)時(shí),新聞出版署期刊司說,這是一個(gè)全新的事物,他們之前也沒有任何經(jīng)驗(yàn)。讓我們先辦,也是給我國以后的電子刊摸索出一些經(jīng)驗(yàn)?!?回憶起29年前去新聞出版署的場景,許瓏說。
區(qū)別于《神州學(xué)人》雜志主要發(fā)表原創(chuàng)文章的模式,電子刊摘選匯集了當(dāng)時(shí)許多媒體的精華文章?!渡裰輰W(xué)人》電子版的出版,主要分為兩個(gè)部分:神州學(xué)人編輯部負(fù)責(zé)內(nèi)容建設(shè),CERNET負(fù)責(zé)電子刊的發(fā)布、網(wǎng)頁的創(chuàng)建、運(yùn)營和維護(hù)。
△2004年,CERNET網(wǎng)絡(luò)中心李星、朱爽回顧C(jī)HISA的創(chuàng)辦
名副其實(shí)的技術(shù)維護(hù)咨詢
《神州學(xué)人》電子版最初的服務(wù)器是一臺當(dāng)時(shí)流行的Sun Sparc 20工作站,位于清華大學(xué)主樓CERNET的機(jī)房。
電子版的發(fā)布由CERNET網(wǎng)絡(luò)中心朱爽和李星老師共同完成。在當(dāng)年那十分簡單,卻十分醒目的《神州學(xué)人》電子版的版權(quán)頁上,寫著一行字:“技術(shù)維護(hù)咨詢:朱爽,李星,chisa-tech@chisa.edu.cn ”。
“我們名副其實(shí),哈哈?!敝焖貞浾f?!盀榱粟s國外讀者閱讀的時(shí)差,選定在每周周五發(fā)刊?!?/p>
雖然設(shè)備已經(jīng)是當(dāng)時(shí)的最好,但互聯(lián)網(wǎng)是那么新,全球當(dāng)時(shí)的網(wǎng)絡(luò)硬件環(huán)境、發(fā)布技術(shù)和軟件環(huán)境都剛剛起步:短短兩萬多字的文字內(nèi)容,有時(shí)要花上幾個(gè)小時(shí)才能發(fā)布完成。為了電子版的發(fā)布和網(wǎng)上傳播萬無一失,李星和朱爽進(jìn)行了大量的準(zhǔn)備。為保證1月12日順利發(fā)刊,他們要在1月6日發(fā)布“試刊”。在試刊的過程中,解決了許多技術(shù)上的小挑戰(zhàn)。
最初,電子刊只是簡單的文件格式,編輯部制作成磁盤,由專人送到CERNET網(wǎng)絡(luò)中心,后來通過FTP上傳到網(wǎng)絡(luò)中心,再后來,就直接以撥號上網(wǎng)的方式上傳到服務(wù)器了。
在收到編輯部發(fā)來的期刊后,他們將當(dāng)期的內(nèi)容生成各種編碼版本,包括GB、BIG5、HZ、T3、ISO2022-CN和Postscript等,這些今天我們看來非常簡單的技術(shù),在當(dāng)時(shí)卻是相當(dāng)專業(yè)、超前的。經(jīng)過編碼后的版本被發(fā)布到FTP、GOPHER和WWW上,同時(shí)以UUCODE編碼郵件,發(fā)送到海外留學(xué)人員的訂閱郵箱中。
“無論是在外出差還是寒暑假,我們都想方設(shè)法地保證在周五按時(shí)發(fā)布上線?!敝焖f。
1995年1月15日,李星和朱爽到泰國參加第一屆亞太地區(qū)網(wǎng)絡(luò)信息中心會議。會后,在取道香港回北京時(shí),正好是個(gè)周五——電子版第二期的發(fā)刊日。他們抵達(dá)香港后,顧不上忙其他事情,第一時(shí)間就去了香港中文大學(xué)網(wǎng)絡(luò)中心,為的就是準(zhǔn)時(shí)發(fā)布《神州學(xué)人》電子版。
“電子刊創(chuàng)刊僅僅幾個(gè)月,隨機(jī)瀏覽人數(shù)就達(dá)到了數(shù)萬人,訂閱人數(shù)有8000多個(gè)?!痹S瓏說。一時(shí)間,《神州學(xué)人》電子版成為了中國互聯(lián)網(wǎng)上的一道亮點(diǎn),連版權(quán)頁的技術(shù)維護(hù)咨詢郵箱都收獲了許多讀者熱情洋溢的來信?!坝胁簧僮x者詢問英文環(huán)境下閱讀中文的問題,我們當(dāng)即做了一個(gè)如何在網(wǎng)上閱讀中文的指南。后來,為了方便讀者查找信息,我們還做了詳細(xì)目錄分類檢索。記得李星老師還常?,F(xiàn)寫一些小的軟件來幫助發(fā)布,比如檢查編碼錯(cuò)誤等等?!敝焖貞?。
在那段時(shí)間里,為了讓電子刊發(fā)布得更好更快,他們研究出了很多小技巧,比如電子郵件討論組技術(shù)(MAILING-LIST)。后來,《神州學(xué)人》電子版還有了詳細(xì)的目錄分類。當(dāng)時(shí)李星教授帶的一位研究生還針對電子版內(nèi)容的特殊性,設(shè)計(jì)了最初的中英文搜索引擎,方便讀者查找電子版上的有關(guān)資料。這在當(dāng)時(shí)互聯(lián)網(wǎng)剛剛興起的全球,都是非常實(shí)用、有趣的探索。
開創(chuàng)了一個(gè)先河
1995年的夏天,時(shí)任國家教委主任朱開軒、副主任韋鈺來到了位于CERNET網(wǎng)絡(luò)中心的機(jī)房,視察電子刊工作的進(jìn)展情況。韋鈺表示:“《神州學(xué)人》電子版是與《神州學(xué)人》雜志比翼齊飛的一份電子雜志。”
“電子雜志發(fā)布后,收到了來自全世界的聲音,每一期內(nèi)容刊發(fā)后,都有幾百個(gè)留學(xué)生給我們發(fā)Email互動。大家把身在異國他鄉(xiāng)的所思所感都通過互聯(lián)網(wǎng)與我們分享,非常讓人感動?!痹S瓏說。
在沒有其他來自祖國的中文刊物上網(wǎng)的年代,這份來自祖國的聲音彌足珍貴。當(dāng)時(shí)的讀者紛紛表示:“讀到神州學(xué)人電子版,猶如飲到了沙漠中的甘泉,聽到了來自北京的聲音?!薄霸趪馔ㄟ^《神州學(xué)人》電子版直接點(diǎn)擊國內(nèi)要聞和自己感興趣的欄目,倍覺親切溫暖,心能與祖國一起跳動。”
《神州學(xué)人》電子版的問世,開創(chuàng)了國內(nèi)中文媒體進(jìn)入國際互聯(lián)網(wǎng)的先河,具有劃時(shí)代的歷史意義,它的創(chuàng)辦,立即引起了國內(nèi)媒體的關(guān)注,中央電視臺新聞聯(lián)播、新華社、人民日報(bào)等媒體都迅速發(fā)布了消息。
隨著《神州學(xué)人》電子版影響力的增大,國務(wù)院新聞辦公室將其納入了國家對外新聞宣傳平臺。國內(nèi)高校編寫的新聞學(xué)教科書也將《神州學(xué)人》電子版的誕生作為開創(chuàng)性的歷史事件,編入了我國新聞發(fā)展史。
1995年,美國國會圖書館電腦網(wǎng)絡(luò)中心OCLC(Online Computer Library Center)將《神州學(xué)人》電子版正式編目,成為被此類大型圖書館編目的第一個(gè)中國大陸的中文新聞媒體。
“有一次我看王小丫主持的《開心辭典》,其中一個(gè)問題是‘我國最早的電子期刊是哪一家’?臺下一位來自媒體的答題者很快就說:《神州學(xué)人》!我當(dāng)時(shí)非常的激動和自豪?!被仡櫷?,已經(jīng)退休多年的許瓏說。
擴(kuò)展閱讀:1990年代的網(wǎng)絡(luò)刊物發(fā)行技術(shù)
三十年前網(wǎng)絡(luò)刊物發(fā)行技術(shù)與當(dāng)今并不一樣。為了適應(yīng)全世界各個(gè)地區(qū)讀者環(huán)境的多樣性,《神州學(xué)人》網(wǎng)絡(luò)版發(fā)行了不同的形式,使用不同的中文編碼方法。
一、應(yīng)用協(xié)議
1.郵件列表(Mailing List)
郵件列表的起源可以追溯到1975年,是互聯(lián)網(wǎng)上最早的社區(qū)形式之一,也是Internet上的一種重要工具,用于各種群體之間的信息交流和信息發(fā)布。
早期的郵件列表是一個(gè)小組成員通過電子郵件討論某一個(gè)特定話題,一般稱為討論組,由于早期聯(lián)網(wǎng)的計(jì)算機(jī)數(shù)量很少,討論組的參與者也很少。討論組很快就發(fā)展演變出另一種形式,即有管理者管制的討論組,也就是通常所說的郵件列表,或者叫狹義的郵件列表。
由于互聯(lián)網(wǎng)早期使用ASCII編碼,只有7比特,電子郵件、域名系統(tǒng)(DNS)等主流應(yīng)用只支持7比特的透明傳輸,因此,對于中文等多字節(jié)文字(每個(gè)字節(jié)的全部8比特均需傳輸)必須轉(zhuǎn)換成7比特字符。從而《神州學(xué)人》郵件列表采用了UUCODE編碼。
2.文件傳輸協(xié)議(FTP)
文件傳輸協(xié)議(File Transfer Protocol)是在計(jì)算機(jī)網(wǎng)絡(luò)的客戶端和服務(wù)器間傳輸文件的應(yīng)用層協(xié)議。傳送文件(file transfer)和訪問文件(file access)之間的區(qū)別在于:前者由FTP提供,后者由NFS等應(yīng)用系統(tǒng)提供。文件傳輸協(xié)議由RFC959規(guī)范。
FTP是8位的客戶端-服務(wù)器協(xié)議,能操作任何類型的文件而不需要后續(xù)處理,就像MIME或Unicode一樣,但FTP有極高的延時(shí),意味著從開始請求到第一次接收數(shù)據(jù)間的時(shí)間非常長,并且必須不時(shí)地執(zhí)行一些冗長的登錄進(jìn)程。
Chrome和Firefox等主流瀏覽器都計(jì)劃棄用對FTP的支持, 2019年推出的Chrome 82已停止對FTP支持,2020年疫情原因?qū)е逻h(yuǎn)程辦公需求增加,Chrome短暫地恢復(fù)了FTP,但于2021年10月推出的Chrome95完全移除了FTP相關(guān)代碼。而Firefox原計(jì)劃在版本77中停止支持FTP,最終在2021年7月發(fā)行的90版正式停止支持FTP協(xié)議。微軟的Edge瀏覽器也在2020年起停止支持FTP,Internet Explorer 11仍保留FTP客戶端,直到2022年6月15日終止支持。
3.地鼠(Gopher)
Gopher是一個(gè)互聯(lián)網(wǎng)上使用的分布型的文件搜集獲取網(wǎng)絡(luò)協(xié)議。它是1991年由明尼蘇達(dá)大學(xué)發(fā)明的?!癎opher”(地鼠)這個(gè)名字有三層含義:第一是“挖掘信息”;第二,使用菜單形式搜集來的信息與地鼠洞相類似;第三,明尼蘇達(dá)大學(xué)有一支運(yùn)動隊(duì)名叫“黃金地鼠隊(duì)”。
Gopher最初的設(shè)計(jì)目標(biāo)與萬維網(wǎng)類似:共享文檔。今天的萬維網(wǎng)幾乎已經(jīng)替代了Gopher。但Gopher協(xié)議還提供了一些萬維網(wǎng)先天缺乏的功能,比如在Gopher中所有信息都以層級形式存儲,這被認(rèn)為是存儲大量信息的最好方式之一。
萬維網(wǎng)在1991年被發(fā)明,由于耗用帶寬較少,Gopher網(wǎng)絡(luò)當(dāng)時(shí)仍然是非常流行和制作精良的。1993年2月,明尼蘇達(dá)大學(xué)宣布他們將對Gopher的使用收取執(zhí)照費(fèi),這就部分減少了Gopher服務(wù)器數(shù)量。一些人相信這是Gopher變成互聯(lián)網(wǎng)歷史的原因。很多人相信Gopher的衰微實(shí)際上是它那有限制的結(jié)構(gòu)造成的,這種結(jié)構(gòu)使得它沒有自由形態(tài)的HTML網(wǎng)頁靈活。使用Gopher時(shí),每個(gè)文檔都已有一個(gè)預(yù)定義的格式和類型,一個(gè)Gopher用戶必須通過一個(gè)服務(wù)器定義的系統(tǒng)菜單導(dǎo)航進(jìn)某一個(gè)特定的文檔。很多人不喜歡Gopher系統(tǒng)中這種人為制造的菜單和文件的區(qū)分,而Web網(wǎng)絡(luò)上使用的超文本協(xié)議和交互式應(yīng)用程序顯得更為開放靈活。
4.萬維網(wǎng)(WWW)
萬維網(wǎng)(World Wide Web)是一個(gè)通過互聯(lián)網(wǎng)訪問的、由許多互相鏈接的超文本組成的信息系統(tǒng)。英國科學(xué)家蒂姆·伯納斯-李于1989年發(fā)明了萬維網(wǎng),1990年,他在瑞士CERN工作期間編寫了第一個(gè)網(wǎng)頁瀏覽器。網(wǎng)頁瀏覽器于1991年1月向其他研究機(jī)構(gòu)發(fā)行,并于同年8月向大眾開放。
萬維網(wǎng)是信息時(shí)代發(fā)展的核心,也是數(shù)十億人在互聯(lián)網(wǎng)上進(jìn)行交互和瀏覽的主要工具。網(wǎng)頁主要是文本文件格式化和超文本置標(biāo)語言(HTML)。除了格式化文字之外,網(wǎng)頁還可能包含圖片、影片、聲音和軟件組件,這些組件會在用戶的網(wǎng)頁瀏覽器中呈現(xiàn)為多媒體內(nèi)容的頁面。萬維網(wǎng)并不等同于互聯(lián)網(wǎng),萬維網(wǎng)只是互聯(lián)網(wǎng)所能提供的服務(wù)之一,是靠著互聯(lián)網(wǎng)運(yùn)行的一項(xiàng)服務(wù)。
1993年4月30日,歐洲核子研究組織宣布萬維網(wǎng)對任何人免費(fèi)開放,且不收取任何費(fèi)用。兩個(gè)月之后,Gopher協(xié)議宣布不再免費(fèi)使用,造成大量用戶從Gopher轉(zhuǎn)向萬維網(wǎng)。早期流行的網(wǎng)頁瀏覽器是用于Unix和X Windows系統(tǒng)的ViolaWWW。
學(xué)者普遍認(rèn)為,萬維網(wǎng)的一個(gè)轉(zhuǎn)折點(diǎn)始于1993年推出的Mosaic網(wǎng)頁瀏覽器,這是由伊利諾伊大學(xué)厄巴納-香檳分校(NCSA-UIUC)的國家超級計(jì)算機(jī)應(yīng)用中心團(tuán)隊(duì)所開發(fā)的圖形接口瀏覽器,由馬克·安德里森領(lǐng)導(dǎo)。Mosaic的資金來自美國高速運(yùn)算及通信計(jì)劃(High-Performance Computing and Communications Initiative)和高速運(yùn)算及通信法案(High Performance Computing and Communication Act of 1991),這也是美國參議員阿爾·戈?duì)査l(fā)起的幾項(xiàng)運(yùn)算發(fā)展計(jì)劃之一。在Mosaic發(fā)布之前,網(wǎng)頁中的圖片和文字混合并不常見,萬維網(wǎng)的受歡迎程度遠(yuǎn)低于互聯(lián)網(wǎng)上使用的舊協(xié)議,例如Gopher和WAIS。Mosaic的圖形使用接口讓萬維網(wǎng)成為迄今為止最受歡迎的互聯(lián)網(wǎng)協(xié)議。
1994年10月,萬維網(wǎng)聯(lián)盟(W3C)在麻省理工學(xué)院計(jì)算機(jī)科學(xué)實(shí)驗(yàn)室成立,建立者是萬維網(wǎng)的發(fā)明者蒂姆·伯納斯-李。到了1994年底,全球網(wǎng)站數(shù)量仍然相對稀少,但是很多著名網(wǎng)站已經(jīng)相當(dāng)活躍,這些網(wǎng)站已經(jīng)預(yù)示或者啟發(fā)了當(dāng)今最流行的服務(wù)。
二、中文編碼
1.UUCODE (uuencoding)
uuencode這個(gè)名字衍生自"Unix-to-Unix encoding",原先是Unix系統(tǒng)下將二進(jìn)制的資料借由uucp郵件系統(tǒng)傳輸?shù)囊粋€(gè)編碼程式,是一種二進(jìn)制到文字的編碼。uudecode是與uuencode搭配的解碼程式,uuencode/decode常見于電子郵件中的檔案傳送以及usenet新聞組和BBS的貼文等等。近來已被MIME大量取代。
2.GB
GB/T 2312,GB/T 2312—80 或 GB/T 2312—1980 是中華人民共和國國家標(biāo)準(zhǔn)簡體中文字符集,全稱《信息交換用漢字編碼字符集·基本集》,通常簡稱GB(“國標(biāo)”漢語拼音首字母),又稱GB0,由中國國家標(biāo)準(zhǔn)總局于1980年發(fā)布,1981年5月1日實(shí)施。
在GB 2312內(nèi),每個(gè)漢字及符號的碼位使用兩個(gè)字節(jié)來表示。第一個(gè)字節(jié)稱為“高位字節(jié)”,對應(yīng)分區(qū)的編號(把區(qū)位碼的“區(qū)碼”加上特定值);第二個(gè)字節(jié)稱為“低位字節(jié)”,對應(yīng)區(qū)段內(nèi)的個(gè)別碼位(把區(qū)位碼的“位碼”加上特定值)。
3.BIG5
大五碼(英語:Big5,又稱五大項(xiàng)目碼、五大碼)是繁體中文社群最常用的電腦漢字字符集標(biāo)準(zhǔn),共收錄13060個(gè)漢字。
大五碼是雙字節(jié)字符集,以十六進(jìn)制表示,使用雙八碼存儲方法,以兩字節(jié)安放一字。第一字節(jié)稱為“高位字節(jié)”,第二字節(jié)稱為“低位字節(jié)”。
4.Postscript
PostScript(PS)是一種頁面描述語言和編程語言 ,由Adobe Systems公司于1984年推向市場。大概在這個(gè)時(shí)候,史蒂夫·喬布斯參觀了Adobe公司的工作,并敦促他們改進(jìn)PostScript作為驅(qū)動激光打印機(jī)的語言,將其添加到Canon打印機(jī),誕生了LaserWriter。1985年3月,Apple LaserWriter是第一款帶有PostScript的打印機(jī),這也帶來了1980年代中期的桌面印刷革命。它的技術(shù)優(yōu)點(diǎn)和廣泛應(yīng)用使得PostScript成為打印應(yīng)用領(lǐng)域影像輸出的一個(gè)選擇。直到1990年代,PostScript語言解釋器,有時(shí)稱作Raster image processor,曾經(jīng)一度成為激光打印機(jī)的一個(gè)普通組成部分。隨著使用電子方式發(fā)布文檔最終版本成為事實(shí)上的標(biāo)準(zhǔn),PostScript就在這個(gè)領(lǐng)域不斷地被它的后續(xù)版本Portable Document Format(PDF)所超越。
5.HZ
HZ編碼是1988年發(fā)明的編碼系統(tǒng)。其目的是在7字節(jié)的限制下(如電子郵件)儲存GB/T 2312的雙字節(jié)字符。
其在ISO 2022編碼字符的前后分別加上轉(zhuǎn)義字符~{(7E 7B)和~}(7E 7D)后,使用正常的ASCII轉(zhuǎn)碼變成 ASCII 字符。部分機(jī)器也可以接受使用EUC-CN編碼的轉(zhuǎn)義字符。
HZ出現(xiàn)于RFC 1843《HZ - A Data Format for Exchanging Files of Arbitrarily Mixed Chinese and ASCII characters》,作者來自斯坦福大學(xué)。
6.T3
T3其目的是在7字節(jié)的限制下(如電子郵件)儲存BIG5的雙字節(jié)字符。
7.ISO2022-CN
為避開ASCII字符中的不可顯示字符(十六進(jìn)制為0×00至0×1F,十進(jìn)制為0至31)及空格字符(十六進(jìn)制為0×20,十進(jìn)制為32),國標(biāo)碼(又稱為交換碼)參考ISO 2022規(guī)定表示非ASCII字符雙字節(jié)編碼范圍為十六進(jìn)制為 <21 21>-<7E 7E>,十進(jìn)制為 (33, 33) 至 (126, 126)。因此,在進(jìn)行碼位轉(zhuǎn)換時(shí),須將“區(qū)碼”和“位碼”分別加上32(十六進(jìn)制為0×20)作為國標(biāo)碼。
在這個(gè)編碼模式內(nèi),軟件需要使用低端控制字符(C0),高端控制字符(C1)和US-ASCII字符集(GL)標(biāo)注字符屬于單字節(jié)(ASCII)還是雙字節(jié),相對容易造成亂碼(如丟失控制/轉(zhuǎn)義字符)。
ISO2022-CN在RFC 1922《互聯(lián)網(wǎng)消息的漢字編碼》(Chinese Character Encoding for Internet Messages)中被定義。RFC1922是中國大陸的第一個(gè)RFC,其主要作者來自清華大學(xué)。
8.UNICODE
Unicode,全稱為Unicode標(biāo)準(zhǔn)(The Unicode Standard),其官方機(jī)構(gòu)Unicode聯(lián)盟所用的中文名稱為統(tǒng)一碼,又譯作萬國碼、統(tǒng)一字符碼、統(tǒng)一字符編碼,是信息技術(shù)領(lǐng)域的業(yè)界標(biāo)準(zhǔn),其整理、編碼了世界上大部分的文字系統(tǒng),使得電腦能以通用的字符集來處理和顯示文字,不但減輕在不同編碼系統(tǒng)間切換和轉(zhuǎn)換的困擾,更提供了一種跨平臺的亂碼問題解決方案。Unicode由非營利機(jī)構(gòu)Unicode聯(lián)盟(Unicode Consortium)負(fù)責(zé)維護(hù),該機(jī)構(gòu)致力于讓Unicode標(biāo)準(zhǔn)取代既有的字符編碼方案,因?yàn)榧扔蟹桨妇幋a空間有限,亦不適用于多語環(huán)境。
Unicode伴隨著通用字符集ISO/IEC 10646的標(biāo)準(zhǔn)而發(fā)展,同時(shí)也以書本的形式對外發(fā)表。Unicode至今仍在不斷增修,每個(gè)新版本都加入了更多新的字符。目前最新的版本為2022年9月公布的15.0.0,已經(jīng)收錄超過14萬個(gè)字符(第十萬個(gè)字符在2005年獲得采納)。Unicode標(biāo)準(zhǔn)不僅僅是為文字指定代碼。除了涵蓋視覺上的字形、編碼方法、標(biāo)準(zhǔn)的字符編碼資料外,聯(lián)盟官方出版品還包含了關(guān)于各書寫系統(tǒng)的細(xì)節(jié)及呈現(xiàn)方式,如規(guī)范化的準(zhǔn)則、拆分、測序、繪制、雙向文本顯示、書寫方向、字符特性(如大小寫字母)等等。此外還提供參考資料和視覺圖像,以幫助開發(fā)者和設(shè)計(jì)師正確應(yīng)用標(biāo)準(zhǔn)。
Unicode備受認(rèn)可,被ISO納入國際標(biāo)準(zhǔn),成為通用字符集,即 ISO/IEC 10646。Unicode兼容ISO/IEC 10646,能完整對應(yīng)各個(gè)版本標(biāo)準(zhǔn)。Unicode廣泛應(yīng)用于電腦軟件的國際化與本地化過程。很多新科技,如可擴(kuò)展置標(biāo)語言(Extensible Markup Language,簡稱:XML)、Java編程語言以及現(xiàn)代操作系統(tǒng),都采用Unicode來編碼。Unicode最普遍的編碼格式是和ASCII兼容的UTF-8,以及和UCS-2兼容的UTF-16。
(以上資料來自網(wǎng)絡(luò))
來源:中國教育和科研計(jì)算機(jī)網(wǎng)CERNET