瀏覽單個文章
sodana
New Member
 

加入日期: Dec 2001
您的住址: 淡水
文章: 5
稍微整理一下我手上的UAO資料...
大家都聽過unicode補完計畫
但知道這個工具是在幹麼的呢?

windows本身就是unicode系統了
unicode補完計畫...也只是uao碼而已
那什麼是UAO碼...
就是針對big-5補充的繁體缺漏字...日文假名...日文漢字...簡體字等等
字碼起源大致是來自櫻花輸入法...中國海字集等等
早在dos時代
因為有對日文...俄文等等的需求
故倚天中文系統推出泰山輸入法
這個就是櫻花輸入法的前身
到了win95也面臨相同的問題
於是Roy Liu-Yi Hwu前輩努力創作出櫻花輸入法
讓win9x big-5環境下可以使用日文
只是windows的原罪在於幾乎的文字字碼都可以命名為檔案檔名
也因此原來只是處理文字的big-5日文碼會被用來為檔案命名
在當時也沒什麼問題
因為本身系統下就是ANSI
也因此不會跟日本的編碼互衝
只是到了win2000...winxp的時候
主要系統用unicode
因此檔案可以用用多國語言文字命名
也就是說內涵繁體中文字跟日文字跟簡體字的檔名可以存在
但是為了向下相容以及地方語言選項的設定
使得用ANSI編碼的軟體只能處理該語系下的檔案
例如地方語系設成台灣的話
ANSI編碼的軟體就是只能處理big-5碼下命名的檔案與資料夾
日文...俄文...簡體文命名的檔案與資料夾就無法處理
接下來是重頭戲

1.ANSI編碼與unicode編碼的軟體

簡單來說能處理多國語言的軟體就是unicode編碼
特點就是不受地方選項地區的限制
反之就是ANSI編碼
nero不能中文檔案跟日文檔案一起燒 -> 因為ANSI編碼
winamp不能同時播放日文命名跟中文命名的音樂檔 -> 因為是ANSI編碼
如果愛用某軟體卻發現無法處理unicode...
請跟該製作團體請求改成unicode編碼
這是最好最徹底的解決方法

2.關於unicode

為了在電腦上輸入文字
各國都有合乎自己國家語言的編碼
像是台灣的big-5...日本的shift-jis與EUC與jis...中國的gb等等
例如在big-5下"史"這個字的編碼是A576
但shift-jis下則是在8E5F
所以ANSI無法處理多國文字
也因此為了處理多國文字
unicode為此而產生
收入各國常用字並與各個字碼連結
不僅可以處理多國語言也可以跟各國相同的字碼溝通
在utf-8碼下"史"這個字是E58FB2
編碼溝通以"史"這個字為例

big-5(A576) <=> utf-8(E58FB2) <=> shift-jis(8E5F)

也就是說在處理多國文字上unicode可以發揮他最大的價值
反過來說如果平常只有使用繁體中文或者日文的話
就沒必要用unicode了

3.big-5碼與造字區

由於種種因素以及軟弱無能的政府
讓big-5這個非官方字碼可以苟延殘喘這麼久並可以成為台灣地區繁體中文編碼的代表
big-5本身最大的詬病就是本身收錄字不足
像是常用卻沒收錄以及罕見用字等等
為了填補這個漏洞因此不管DOS的倚天中文系統以及win95開始都有所謂的使用者造字區
也就是自創所需但缺乏的文字例如"'方方土"
因應這項需求而生的就是中國海字集
利用造字區增補了相當多的缺漏字
只是使用者造字有個根本性的問題
也就是利用造字區所造出來的字只能在該電腦上顯示...列印等等
如果拿到其他的電腦上
因為可能不是使用相同的增補字集或造同樣的字
因此會顯示空白或其他的字碼

4.UAO的原理

UAO簡單來說就是用造字區來收錄他們所定義的字
也就是big5(UAO)的狀態
只是他們強制與unicode編碼連結
例如big-5的日文假名
強制連結下使得

big-5(UAO) <=> unicode <=> shift-jis
這樣的情況
NERO裝了UAO之後可以中文檔案跟日文檔案一起燒?
不是UAO使得nero可以處理多國語言文字
而是nero燒的是UAO碼
也就是造字區字碼
本身致命的缺陷也就是我上面所說的造字區
別人沒裝UAO的話燒錄出來的光碟裡面的檔案及資料夾的檔名就會是亂碼
unicode補完計畫這塊招牌顯得名不其實
windows本身就有unicode了
而unicode補完計畫本身也只是在補big-5而已
這樣有欺騙使用者的嫌疑
而現在越來越大
連簡體字都有了
不知道哪一天會不會連法文俄文等等都收錄進來

不是裝UAO才能使用unicode...而是windows本身就能使用unicode
UAO只是騙使用者以為裝了UAO...ANSI編碼的軟體就能處理unicode...
但實際上只是ANSI編碼的軟體處理造字區裡面的UAO碼

UAO最能施展的地方不外於bbs以及ANSI編碼的軟體如nero跟winamp等等
但是並非是不使用UAO不可的

1.bbs
因為bbs的環境下是用ANSI編碼
所以有上bbs的人為了顯示缺漏字以及顯示UAO的日文字所以以裝UAO
如果你不想安裝UAO的話可以試試PieTTY
內部是用UAO轉碼...可倚在不安裝UAO的情況下顯示UAO字碼
而我的情況是用pcman+UWCXMF字型
可以顯示櫻花的big-5日文假名以及部分的繁體缺漏字
雖然不完全但是對我來說已經夠用了
一勞永逸解決的方法就是等telnet server跟telnet clinet對應unicode

2.ANSI編碼的軟體
很抱歉ANSI編碼的軟體無法處理unicode
只能請製作該軟體的團隊儘快推出對應unicode的版本
又或者使用其他相同功能但用unicode編碼的軟體
但如果要執行其他語系的軟體或檔案的話
可以在地方選項變換成該國語系下作業
又或者可以安裝Microsoft AppLocale
Microsoft AppLocale的優點在於可以在不重新開機的情況下以其他國家語系下執行作業
而地方選項需要重新開機一次
例如內有日文命名的檔案或資料夾的壓縮檔
在台灣語系下使用ANSI編碼的壓縮軟體無法將該壓縮檔解壓縮
但用Microsoft AppLocale以日文環境下啟動ANSI編碼的壓縮軟體解壓縮
只是以上兩個方法都不能保證百分之百可用
只是用來過渡的方法
最好的方法就是使用該國語系的windows等等的OS

3.網頁方面
簡單又直接的解決方法就是該web server改成處理unicode
自己製作的網頁編碼也使用unicode
連"方方土"這個字utf-8都有收錄

結論
我有安裝過UAO的早期版本
因為反安裝而使日文命名的檔案與資料夾全部變成big-5日文(作業系統是xp)
也因此有著不好的回憶
之前有幫過朋友處理過反安裝UAO後檔案與資料夾都變成亂碼的問題
而UAO現在最大的問題而是無法完全送出unicode碼吧
如果UAO能修正以上的問題的話應該就無缺點了
只是我永遠不會再裝UAO了
以前win95的時候因為作業系統的限制所以櫻花才會因應而生
但是現在有unicode...作業系統也有支援
而我無法忍受big-5下還塞日文碼與簡體中文碼
UAO的普及只會妨礙unicode的發展以及延續big-5的壽命

只是big-5的缺漏字問題要完全解決
就等我們台灣何時出現大有為的政府推出取代big-5的無缺漏字問題的新編碼並強力普及
在那之前只能用中國海字集了

最後你看完我的文章後不認同我的想法又或者要繼續使用UAO的話
就請你.......

忘了吧忘了吧忘了吧忘了吧

因為我反UAO
但你支持UAO的話我以上的言論就對你毫無用處
如果記下來的話對精神健康將會是非常大的傷害
大家理念不同的話也只能分道揚鑣
只是最後請記住
安裝什麼軟體之前請知道他到底是在幹麼的

最後請各位使用電腦愉快
舊 2006-03-04, 06:27 AM #168
回應時引用此文章
sodana離線中