來源:中國青年報
2023-05-10 08:55:05
原標題:守護困在信息系統(tǒng)“盲區(qū)”的生僻字
來源:中國青年報
原標題:守護困在信息系統(tǒng)“盲區(qū)”的生僻字
來源:中國青年報
http://vod.cyol.com/vod/data/video/202305/10/faea65b8-b41d-415d-c220-ceca352992bf/transcode_29fbfa15-313f-6a03-6ae8-f99a8b7e.mp4/av-g.m3u8
最近,一個生僻字沖上熱搜。[(上邊是少了一橫的“鳥”,下邊是“甲”),nia,四聲]姓是云南麗江傈僳族中一支以鳥為圖騰家族的姓氏,這個字為上下結(jié)構(gòu)的漢字,上邊是少了一橫的“鳥”,下邊是“甲”。
進入數(shù)字時代,由于(nià)這個姓氏無法在信息系統(tǒng)中使用,為避免購票、辦卡等均無法正常輸入、顯示的麻煩,該姓氏的上百人被迫把姓改成了“鴨”。
據(jù)統(tǒng)計,全國有6000萬人名及大量地名、古籍、方言中包含生僻字,其中多數(shù)尚未實現(xiàn)數(shù)字化。很多人名、地名中的生僻字還無法在信息化系統(tǒng)中正常使用。
數(shù)字時代,我們該如何守護那些被困在信息系統(tǒng)“盲區(qū)”的漢字?中青報·中青網(wǎng)記者在溫暖一平方直播間展開了采訪。
中國社會科學(xué)院語言研究所研究員、原詞典編輯室主任譚景春認為:“漢字正是由于獨特的表意方塊形體,才具備超時間和空間的能力,使得我國7個大方言區(qū)的人們的交流在書面上能夠順利進行,也使得中國幾千年的燦爛文化能夠留傳至今。”
譚景春表示,“漢字收錄在《康熙字典》里的有4萬多個,收錄在《漢語大字典》里的有6萬多個,收錄在《中華字海》里的有87019個。不過現(xiàn)代通用的也就5000到8000個,比如2013年6月,由國務(wù)院正式發(fā)布的《通用規(guī)范漢字表》收錄了8105個漢字”。幾千年來,漢字在維護民族和國家的統(tǒng)一,記錄和保存文化遺產(chǎn)等方面發(fā)揮了巨大的作用。
每一個生僻字姓氏,往往承載著本土文化的“基因”。
《中國民間故事叢書》的云南麗江華坪卷,記述了關(guān)于傈僳“nià”姓來歷的傳說故事。
傳說很久很久以前,深居在大山里的一戶傈僳族人家生下了一個小孩,但沒幾天小孩的媽媽因病去世,父親用鳥肉湯喂養(yǎng)小孩活下來,逐漸長大。為了讓孩子記住這段經(jīng)歷,父親就給他取了一個名,叫“nià”,意思是用鳥肉湯喂大的孩子。從此以后,傈僳族中就有了這個姓氏。
“nià”這個姓氏留存著傈僳族對如守護神一般鳥類的紀念和崇拜。因姓氏無法在信息系統(tǒng)中順暢地輸入與顯示,為了避免麻煩被迫改姓“鴨”,這是一種何其無奈的遺憾。“棄用”生僻漢字,無疑意味著當?shù)厝吮黄雀钌崃艘欢紊詈竦拿褡鍤v史文化。
[(冫口),zhàn]子莊位于山東省日照市東港區(qū)濤雒鎮(zhèn)駐地東南7公里,緊鄰黃海,交通便捷。因“(冫口)”字生僻,20世紀80年代地名標準化的過程中,在官方名稱里被同音字“棧”替代。
山東日照棧子村村民傅承田接受中青報·中青網(wǎng)記者采訪時表示,傳說清朝時一位軍官發(fā)現(xiàn)地圖上此地沒有名字,便集思廣益,讓當?shù)厝艘黄鹑∶2糠肿x書人觀察地形、方位和周圍物象,最終造出了“(冫口)”這個字和zhàn的讀音。村里50歲以上的人都知道“(冫口)”字的來歷,但是年輕人對這個字和背后的來歷沒有印象。
傅承田說,該村目前居住著3000多人,在外地的約有四五千人。“我非常希望‘(冫口)’字能夠讓更多人了解,讓我們村的歷史也能返璞歸真”。
由于漢字屬于象形、表意文字,難學(xué)、難記、難寫。進入了數(shù)字時代,用鍵盤輸入漢字仍然存在著難寫的問題——有些漢字打不出來。譚景春認為“這是數(shù)字時代對漢字提出的挑戰(zhàn),同時也是時代給予中華民族的一次機遇”。
在譚景春看來,打不出生僻字,不僅會給一部分人的工作和生活帶來困擾和不便,也意味著寶貴的漢字文化遺產(chǎn)正在流失。
為何生僻字的信息化如此難?
工信部電子工業(yè)標準化研究院中文信息研究室主任黃姍姍介紹,漢字是一種表意文字,跟表音文字不同。每個漢字都有它獨特的含義和字形,那么生僻字其實就是表意字所特有的信息處理問題。“信息系統(tǒng)要認識漢字就需要一字一形一碼來建立對照表,一個漢字有形沒有碼,或者編碼不被某個系統(tǒng)所支持,就成了信息時代的生僻字”。
黃姍姍說,漢字信息化編碼難度高,開發(fā)字庫的工作費時費力,生僻字的標準化專業(yè)又復(fù)雜。“目前的一個痛點是,雖然盡管很多字已經(jīng)被收錄進了標準,但是產(chǎn)品對標準的支持并不充分。大多數(shù)應(yīng)用、軟件產(chǎn)品支持的漢字量都在2萬-3萬,一些個性化的字庫產(chǎn)品甚至只有幾千字”。
黃姍姍坦言,生僻字的搜集和整理是一個長期的工作,已經(jīng)開展了幾十年,未來還會繼續(xù)開展。
日前,由騰訊搜狗輸入法聯(lián)合工信部電子工業(yè)標準化研究院等多方發(fā)布“漢字守護計劃”公益行動,守護那些“被困”數(shù)字時代盲區(qū)的生僻字。
今年4月20日“聯(lián)合國中文日”,搜狗輸入法聯(lián)合多方上線全國首個“生僻字征集”微信小程序,直接面向用戶征集無法輸入的生僻字。該程序是由工信部電子工業(yè)標準化研究院指導(dǎo)和推薦的生僻字提交入口,用戶通過拍照上傳,即可提交。
“生僻字征集”小程序上線后,首日訪問量突破63萬,用戶提交生僻字1404個。經(jīng)專業(yè)審核,通過的生僻字將被賦碼并錄入國標字庫,最終實現(xiàn)在電腦、手機等設(shè)備及信息系統(tǒng)中無障礙地輸入與顯示。
工信部電子工業(yè)標準化研究院副院長孫文龍表示:“電子標準院2022年牽頭制定強制性國家標準GB 18030《信息技術(shù) 中文編碼字符集》,所有政務(wù)服務(wù)、公共服務(wù)的產(chǎn)品與系統(tǒng)均須符合標準,這將有效解決生僻字引發(fā)的公共障礙。”
中青報·中青網(wǎng)記者 沈杰群 來源:中國青年報
想爆料?請登錄《陽光連線》( https://minsheng.iqilu.com/)、撥打新聞熱線0531-66661234或96678,或登錄齊魯網(wǎng)官方微博(@齊魯網(wǎng))提供新聞線索。齊魯網(wǎng)廣告熱線0531-81695052,誠邀合作伙伴。