延伸話題,這是我去年在另一個論壇的貼文(有增補論述內容和修飾用字遣詞):
「漢字部件輸入法表格檔」從發想到擱置,過程筆記
中華民國行政院國家發展委員會全字庫
https://www.cns11643.gov.tw/search.jsp?ID=13
部件
https://www.cns11643.gov.tw/search.jsp?ID=14&ID2=18
另外公家機關也有將其背後資料庫內,部分的漢字屬性資料和字形檔開放給民眾免費下載打包檔。
CNS11643中文標準交換碼全字庫(簡稱全字庫)
https://data.gov.tw/dataset/5961
我嘗試摸索閱讀全字庫網站和打包檔的既有內容,產生了一個「發想」:
有沒有可能模仿所謂的漢字字根輸入法的概念,
依據全字庫所提供的五一七個漢字部件的資料集(打包檔內所提供的既有內容),
去二次創作設計一個「全字庫五一七個漢字部件輸入法『表格檔』」 for gcin(linux) /openvanilla(mac) ,
這樣的可能性?
五一七個漢字部件,支援到目前為止所有的「正體字」,以及擴增支援到部分的韓文漢字、日文漢字,
總共支援到將近有「九萬五千個」漢字。
有一位辦公室的前輩,號稱其摸過「中文大鍵盤」。
(我個人是從來都沒有摸過中文大鍵盤,我人生中摸過的第一把電腦鍵盤已經是大五PIN的PC101Key了。)
某日聊天時這位辦公室的前輩聽聞我的發想,提供了他的個人觀點:
依據目前臺灣社會民風的現實(西元201X世代後半之後),
「完全不建議」我肖想自行再二創設計「實體的」「中文大鍵盤」來相容於「全字庫五一七個漢字部件」(拍科幻電影除外)。
而是可以去嘗試另外設計一套機制,想辦法將我所謂的「全字庫五一七個漢字部件」,
全部都塞入臺灣社會目前主流的PC104Key全尺寸鍵盤左下區塊的qwerty區域內的幾十個按鍵之內。
我算了一下,有47個按鍵可以動用,於是我開始想像,有沒有辦法透過「 切 換 鍵 之類的,
把五一七個漢字部件排入這47個按鍵位置內?
我在腦內想像了好久,都想像不出一套合理的「配置機制」來將就於"PC104Key"。
於是「全字庫五一七個漢字部件輸入法表格檔」這個發想,就這樣「擱置」了。
---
不過 中華民國行政院國家發展委員會全字庫 這個官方資料源,目前為止還是有問題在,
就是依舊還是找得出至少近百個漢字,其對應的「部件拆碼」和「部件排序」,有「校稿不確實」的資料瑕疵存在。
簡單來說這個狀況可以透過「地毯式的校稿」來修復問題。
我在201X世代後半也有試過跟公家機關反映問題,但我個人的觀察和理解,公家機關的「基本態度」就是,
民眾反映一個,並且明確指出是哪一個格子內的錯誤,公家機關才會被動地去修正那個格子內的問題,
公家機關「完全不會」主動積極地做「地毯式的校驗」,
來修正該漢字資料庫內「所有」漢字屬性所有可能的、純粹的資料編輯錯誤。
完全把民眾當成實驗白老鼠,坐等民眾反映問題才去修。
(請參考
https://data.gov.tw/dataset/5961 頁面下方的民眾留言區,需耗時數秒鐘等待網頁載入)
我只感覺到遺憾。