“按照任昉《述異記》陸居曰熊,水居曰能的說(shuō)法,還可以讓我們聯(lián)想到另外一個(gè)傳說(shuō)。”
“傳說(shuō)大禹治水,娶塗山氏,在工地豎起一麵鼓,讓塗山氏聽(tīng)到鼓響,就送飯前來(lái)。”
“之後大禹就化作一頭大熊開(kāi)山,結(jié)果有一日工作太投入,飛揚(yáng)的石頭打到了鼓上,大禹卻沒(méi)有注意到。”
“塗山氏聽(tīng)到鼓聲送飯過(guò)來(lái),發(fā)現(xiàn)夫君居然是一頭大熊,受驚過(guò)度,化作了石像。”
“大禹悲痛萬(wàn)分,對(duì)石像說(shuō)你化作石像可以,把兒子給我留下啊。”
“說(shuō)完石像中腹突然打開(kāi),一個(gè)小孩從石像裏掉了出來(lái),這就是‘啟’這個(gè)名字的由來(lái)。”
這一連串的故事和知識(shí),讓對(duì)麵計(jì)算機(jī)係的大老們都聽(tīng)得津津有味,周至這才說(shuō)道:“這傳說(shuō)是不是也說(shuō)明,大禹也繼承了鯀的能力,能夠變化成熊或熊(尼)?”
“而大禹是不是因?yàn)楦惺艿礁赣H的淒慘命運(yùn),最終決定打破禪讓製度,將天下傳給了自己的兒子?”
“是不是還能算作一個(gè)側(cè)證,證明大禹治水的傳說(shuō),是發(fā)生在陶石骨器並用的部落聯(lián)盟時(shí)代?”
“所以大家看,熊(尼),(骨係)這兩個(gè)生僻字如果真的消失了,是不是就會(huì)造成上述華夏文明部分信息資料的缺失?是不是會(huì)在將來(lái)產(chǎn)生一些無(wú)法解答的疑桉?會(huì)不會(huì)造成我們子孫的困惑?”
“以前是因?yàn)闂l件所限,國(guó)人受教育程度不高,快速普及文字,掃除文盲是重中之重,所以簡(jiǎn)化字的推行勢(shì)在必然。gb2312也發(fā)揮了巨大的作用。”
“可如果現(xiàn)在條件明明已經(jīng)允許了,如果我們已經(jīng)有機(jī)會(huì)將所有的文字都采集下來(lái),記錄下來(lái),可我們還是無(wú)動(dòng)於衷,讓這些文字就這樣消失在曆史的長(zhǎng)河裏,而不將之留給子孫,會(huì)不會(huì)是一種將來(lái)的遺憾?”
“如果我們的子孫,因?yàn)槲覀兊脑颍襻岵辉僦佬埽幔ü莻S)這兩個(gè)字以及這兩個(gè)字上說(shuō)承載的曆史文化信息的話,那我們?cè)摬辉撍闶恰褡宓淖锶耍浚 ?br />
“信息技術(shù)最早出來(lái)之前,曾經(jīng)有西方人認(rèn)為,漢字必將因?yàn)橛?jì)算機(jī)技術(shù)的誕生而消亡。”
“經(jīng)過(guò)我們的努力之後,有了gb2312漢字編碼,向那些人證明了他們之前就是純粹的胡說(shuō)八道。”
“而我認(rèn)為,正是因?yàn)樾畔⒓夹g(shù)的發(fā)展,解決了漢字書(shū)寫(xiě)記憶困難的問(wèn)題,漢字的推廣應(yīng)用,甚至完全可能產(chǎn)生革新性的變化。”
“gb2312,證明了我們能行,gb13000,證明了我們能夠做得更好,那麼我們?yōu)槭颤N不趁熱打鐵,幹脆就一次性給它做到極致?”
“做到極致是什麼意思?”李紅江再不敢輕視眼前這小孩了,他是真不知道漢字中承載的這些東西,或者說(shuō)壓根沒(méi)有重視。
這也是如今中國(guó)學(xué)界普遍的一種想象,瘋狂追趕階段,哪裏還敢追求完美?現(xiàn)階段夠用,解決當(dāng)前問(wèn)題,就已經(jīng)是絕大多數(shù)理工科學(xué)者的最高目標(biāo)了。
“做到極致的意思,就是新的字庫(kù)編碼,要做到曆史全兼容,當(dāng)前全收集,未來(lái)可拓展。”周至倒是一點(diǎn)不怵:“曆史全兼容的意思,就是新的字庫(kù),可以完全兼容gb2312和gb13000編碼。已經(jīng)用這兩種編碼錄入的文字信息,用新的編碼同樣能夠完整地讀出來(lái)。”
“當(dāng)前全收集,則指當(dāng)前我們已知的漢字符號(hào),包括大陸簡(jiǎn)化字,寶島、港澳、新島的繁體字,還有島國(guó),朝韓所用的一些漢字符號(hào),全部采納到新編碼體係中來(lái)。”
“未來(lái)可拓展的意思,就是要給字庫(kù)留夠充足的冗餘編碼空間,給將來(lái)采集更多的文字符號(hào)做好準(zhǔn)備。”周至侃侃而談:“剛剛旦增大師已經(jīng)說(shuō)了,我國(guó)是多民族的國(guó)家,很多民族都有自己的文字,這些文字,同樣是我們?nèi)A夏一族大家庭的瑰寶。”
“因此我們要留足這個(gè)字庫(kù)的拓展空間,以備將來(lái)時(shí)機(jī)成熟後,將這些少數(shù)民族的文字也收納進(jìn)來(lái)。”
“這就是我的設(shè)想,關(guān)於華夏標(biāo)準(zhǔn)大字庫(kù)的設(shè)想。”
“呃……周至同學(xué)。”李紅江倒也是光棍:“我給你道個(gè)歉,也給辜老和旦增大師道個(gè)歉,之前自己的確沒(méi)有意識(shí)到這個(gè)問(wèn)題的重要性。”
“但是我之前已經(jīng)說(shuō)了,gb13000是根據(jù)iso/iec1064來(lái)設(shè)計(jì)的,通用多八位編碼字符集的碼位就隻有兩萬(wàn)多個(gè),就好像一個(gè)養(yǎng)殖場(chǎng),雞籠子就這麼多,實(shí)在是裝不下你們說(shuō)的這麼多雞啊?”
“所以說(shuō)這個(gè)多八位編碼字符集是有問(wèn)題的呀,不適合中國(guó)的需要呀,那我們?yōu)槭颤N還要湊合著用呢?”周至反問(wèn)道。
“要是不用這個(gè),那又用哪個(gè)呢?”李紅江倒是不覺(jué)得周至是在無(wú)理取鬧,能夠提出問(wèn)題來(lái)不是本事兒,關(guān)鍵是問(wèn)題提出來(lái)之後,你還得能夠解決問(wèn)題才算。
“為什麼不用unicode呢?”
“unicode?”李紅江想了一下:“unicode八字還沒(méi)一撇吧?國(guó)際標(biāo)準(zhǔn)都還沒(méi)有出來(lái),我們哪來(lái)的參照?”
unicode的漢語(yǔ)翻譯,叫做統(tǒng)一碼,也叫萬(wàn)國(guó)碼、單一碼,是由統(tǒng)一碼聯(lián)盟開(kāi)發(fā)的一項(xiàng)計(jì)算機(jī)科學(xué)領(lǐng)域裏的業(yè)界標(biāo)準(zhǔn),主要就包括字符集和編碼方案。
統(tǒng)一碼是為了解決傳統(tǒng)的字符編碼方案的局限而產(chǎn)生的,它為每種語(yǔ)言中的每個(gè)字符,設(shè)定了統(tǒng)一並且唯一的二進(jìn)製編碼,以滿足跨語(yǔ)言、跨平臺(tái)進(jìn)行文本轉(zhuǎn)換、處理的要求。
統(tǒng)一碼設(shè)計(jì)之初的目的,就是為了打造一個(gè)能夠容納世界上所有文字和符號(hào)的字符編碼方案。
其設(shè)計(jì)思路,就是用數(shù)字0-0x10ffff來(lái)映射所有字符,最多可以容納1114112個(gè)字符,或者說(shuō)有1114112個(gè)碼位。
後世大家所熟悉的utf-8、utf-16、utf-32,其實(shí)都是將數(shù)字轉(zhuǎn)換到程序數(shù)據(jù)的編碼方案。
當(dāng)然這些碼位也不是隨便亂用的,而是規(guī)定了區(qū)間,比如上一世給漢字使用的區(qū)間,就是3400-4dbf,4e00-9fff,20000-3ffff三段,稱(chēng)作:中日韓越統(tǒng)一表意文字區(qū)間。
這就有一百多萬(wàn)個(gè)碼位,裝下所有漢字綽綽有餘。
因?yàn)椴淮嬖谏舷蓿瑄tf理論上還可以繼續(xù)擴(kuò)展。
當(dāng)然從上一世的經(jīng)驗(yàn)來(lái)看,也完全沒(méi)有這個(gè)必要,足夠用了。
溫馨提示:按 迴車(chē)[Enter]鍵 返迴書(shū)目,按 ←鍵 返迴上一頁(yè), 按 →鍵 進(jìn)入下一頁(yè),加入書(shū)簽方便您下次繼續(xù)閱讀。