PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   社會時事發言區 (https://www.pcdvd.com.tw/forumdisplay.php?f=45)
-   -   關於「觀點論述」的一些雜感 (https://www.pcdvd.com.tw/showthread.php?t=1158574)

dusheng 2019-02-27 05:33 PM

你們都搞不清楚民主中國跟共產中國的差異呀!
民主中國當頭,那是中華民國復辟呀!
老共可是承認中華民國那幾十年呦! :agree:
柯跟韓可以反打的就是民主中國,我真的很想自己出征打民主中國牌!
我就贏他們了呀!(被圍毆) :cry:
不管新疆獨?來呀!西藏獨?來呀!台獨?都來!民主中國完全回應您的願望!
只要您不後悔! :D
後悔藥沒機會! :laugh:
民主中國,老柯老韓,剩你們了!民主中國打共產中國!就決定了!
你們合體吧! :laugh:

FLYFLY4 2019-03-01 06:26 PM

試試看一個提問,有問有機會,我想找一種「現成既有」的、可以馬上安裝、馬上使用的電腦文書處理面向的語言和文字輸入輔助材料。
就是以「臺語注音符號」(或 臺語注音符號二式)為輸入基底的中文漢字輸入法表格檔或輸入法軟體。
https://zh.wikipedia.org/zh-tw/臺灣方音符號
條件還要包含:支援的漢字數量,「不能少於」七萬五千個漢字。

我試著下關鍵字google,找到的都是頂多支援一萬多字、或兩萬多字,我找不到七萬五千字以上版本的。
當然也許支援七萬五千個漢字的臺語輸入法早就存在了,只是我個人搜尋能力有限,所以沒有找到!
國語注音符號目前已經累積支援到九萬個漢字以上了,我直覺會認為沒道理臺語不能支援到九萬個漢字以上。
但目前我所能找到的就是最多一萬多字、或兩萬多字。
不要叫我自己做臺語輸入法,這不是我的領域,我只是終端使用者。製作超大字集的臺語漢字輸入法,應該是臺語文創圈該做的事情。

七萬五千字這個數值,是參考自unicode.org之前過往版本的一個漢字蒐集的數量。
也是微軟系統內建的中文輸入法套件之前版本的大字集支援功能全開之後所支援的漢字數量。

沒問題 2019-03-01 08:37 PM

人造語詞這個東西,在現代是不可能被推擴的。

因為沒有實用價值。也沒有功能價值。
簡體字的存在,畢竟筆劃少,好記好寫。
再者,閩語的拼音方案已經很完善,對岸的閩語拼音再加修正就可以完全地適用,區區不超過三十個字符。也就是ABCD二十六個字符的組合變化而以。

另一個問題是,便於溝通。
閩南語的標準化都沒有譜,怎麼談得上通行上的實用?

中國個地的方言,有些早有古字,粵語也有自已的字。
但是粵語也一律不寫古字。原因就是無法溝通。
現代香港是唯一僅存會用古字的地方,但是這仍然沒有讓香港報章雜誌,在近一百年後,使用古字來書寫表達。
且閩語一直到近代前都沒有完整的字。
怎麼溝通?現代人沒有時間去學習已經死亡的文字。就連英語也有很多詞彙都已經不再使用。
連孫中山當年在講演的時候,都會試著用官話,漢語來講演,你幾乎找不到他說粵語的記錄跟影片。

這些人只是在創造一種錯覺,試圖讓這些東西獲得認證。實事上,就算獲得認證也不會有人在乎,也不會有人願意花時間去學習。

dusheng 2019-03-03 07:02 PM

引用:
作者沒問題
人造語詞這個東西,在現代是不可能被推擴的。

因為沒有實用價值。也沒有功能價值。
簡體字的存在,畢竟筆劃少,好記好寫。
再者,閩語的拼音方案已經很完善,對岸的閩語拼音再加修正就可以完全地適用,區區不超過三十個字符。也就是ABCD二十六個字符的組合變化而以。

另一個問題是,便於溝通。
閩南語的標準化都沒有譜,怎麼談得上通行上的實用?

中國個地的方言,有些早有古字,粵語也有自已的字。
但是粵語也一律不寫古字。原因就是無法溝通。
現代香港是唯一僅存會用古字的地方,但是這仍然沒有讓香港報章雜誌,在近一百年後,使用古字來書寫表達。
且閩語一直到近代前都沒有完整的字。
怎麼溝通?現代人沒有時間去學習已經死亡的文字。就連英語也有很多詞彙都已經不再使用。
連孫中山當年在講演的時候,都會試著用官話,漢語來講演,你幾乎找不到他說粵語的記錄跟影片。

這些人只是...

NoNONo... :think:
現在還有人用政治力文化力代替硬實力軟實力嗎?
用立刻馬上迅速代替"立馬"嗎?
沒文化的用語迅速充實了生活用語!
您想新"閩"文會沒有戰鬥力嗎? :laugh:
只要"敢",新世代的流行就能接手. :laugh: :laugh:
我看的是新世代的新民主,點火柴(火柴是什麼?)的火,
廢柴的菸蒂(也能點火),老禿子竟然也能點火.... :confused:
這點我沒算到呀! :think:

冰的啦魔王大人 2019-03-03 08:49 PM

引用:
作者leeko
既然名字不重要,你還敢拼命推銷東奧正名?
你綠得發黑還冒煙,真有臉敢冒充藍軍。 :laugh:



不可污衊法輪聖教!


:)

FLYFLY4 2019-03-06 01:07 AM

正在嘗試編輯一份我「妄想」的「正體中文資訊交換標準碼」的文件檔,啟發自美國的"ASCII"。
我採用試算表格式來整理編輯這份表格,目前收錄有:

國語注音符號(包含有前一個版本所棄用的四個符號,以及聲調符號),
漢數字小寫ま∼十,
全字庫的 三十六個筆順序+五一七個部件+二一四個部首,然後再把這三個其中重複的拿掉,
臺灣傳統環境在用的全形正體中文標點符號數十個(直書和橫書都分開算),
八卦符號八個,
佛教萬字符號左與右旋兩個。

目前為止我整理出來有655個碼位。
當然我無法自己去無中生有那些文字與符號,文件編輯環境的關係,基本上都是要找別人已經做好整理的資料源,再重新整理過。
例如像是 Unicode最新標準版、CNS11643全字庫、中央研究院漢字構形資料庫(金文、甲骨文、楚漢簡帛文字)、教育部異體字字典 等等這些資料源。
至於 臺語注音符號 要不要收錄?這部分我還要再多想想。
一開始在彙整表格之前,我原以為我在初始階段整理出來的這些正體中文漢字部件與符號會超過1024個,結果沒有,只有五分之三的量而已。
畢竟根據十幾年前古早印象中所瀏覽過的中研院期刊文章所述,印象中這些有的沒有的漢字部件與符號加起來的數量是在一千多個∼兩千個之間。

我還在想,還有什麼極具「漢文化」代表性的文字與符號,可以收錄於表格中呢?
搞不好PCDVD網友提到的參考點子,是我之前想破頭都沒想到的,但又合理,這也有可能。

曾經我在MAC討論區發文詢問想找一個MAC環境原生圖形介面的Unicode字元轉碼和顯示查閱軟體,
但是被某些MAC進階電腦玩家給酸很大,建議我滾回去用MsWindows,MAC環境沒有人會有像我這樣的需求。
但運氣很好的,遇到有佛心網友提供了我沒想到的一些關鍵字和自然語言去搜尋,然後我就發現了符合我描述需求的軟體原來早就存在了。

dusheng 2019-03-06 06:38 PM

這麼專業的內容我還是第一次回應,
純粹想測試自己有沒有融入社會,還是就是一個世外老人! :agree:

我記得字碼的部分微軟也有做容許的好像要朝256邁進(那個時代).
當然科技越來越進步,連手機上的表情符號也不用通過系統或輸入法提供了!
共用的字碼及符號會越來越多才是!
是否資料庫越來越升級往上,交叉互用的情況會越真實?
不管各國文字或符號,一個通碼全搞定? :ase
很久沒追這個資訊,有錯請指正! :ase

FLYFLY4 2019-03-06 07:22 PM

我的思考方向是,系統軟體的「底層」「百分之百只有認識」 正體中文漢字 的 字根、部件、部首、筆畫、符號 「而已」,完全 不考慮 也 不要認識 這顆地球上 除了 正體中文漢字體系內 以外的其他所有文字系統與符號,直到「系統的上層」,才再另外做轉碼/對照表與相容設計。為什麼要這樣搞呢?
因為如果哪天,美國人因為政治與戰略需求,而需要破解這樣的「系統底層」,他們第一步就是得先學會「正體中文漢字和中華民國國語」,讓他們學真的沒有關係,鼓勵他們盡量學,因為一個西洋人士終於學好「正體中文漢字和中華民國國語」到可以破解「系統底層」之後,他們其實已經被某種程度的「漢化」了。

dusheng 2019-03-06 07:55 PM

引用:
作者FLYFLY4
我的思考方向是,系統軟體的「底層」「百分之百只有認識」 正體中文漢字 的 字根、部件、部首、筆畫、符號 「而已」,完全 不考慮 也 不要認識 這顆地球上 除了 正體中文漢字體系內 以外的其他所有文字系統與符號,直到「系統的上層」,才再另外做轉碼/對照表與相容設計。為什麼要這樣搞呢?
因為如果哪天,美國人因為政治與戰略需求,而需要破解這樣的「系統底層」,他們第一步就是得先學會「正體中文漢字和中華民國國語」,讓他們學真的沒有關係,鼓勵他們盡量學,因為一個西洋人士終於學好「正體中文漢字和中華民國國語」到可以破解「系統底層」之後,他們其實已經被某種程度的「漢化」了。

個人先說明一下,若干年前,原本微軟作128編碼時已經把各國各族文字"想辦法"納入.
結果"好像"不太夠才有後來的256,然後我也沒再追了!所以不清楚有沒有成功! :ase
只是您說的要全漢字體系,那是否日文韓文也要納入?
又要如何交叉運用表現同文不同意的問題?比如:勉強在中文是不樂意,日文是用功?
(有點忘記意思,反正日語韓語跟中文意思不同的同名詞很多啦!)
如果是這樣難度可能太高,真的是大數據AI等級才玩得起呀!
光漢字就這樣,他還要搞其他國甚至古語,因為語音助手也要進化!
那漫畫裡的超級電腦管理人類生活就實現了耶! :think:
只能默默支持了!我還蠻不期望這一天到來的! :think:
陪長輩去復健科,看了這麼多,我覺得人就是動物,乖乖的走乖乖的動,
放山雞就是比飼料雞健康! :D

FLYFLY4 2019-03-06 10:01 PM

引用:
作者dusheng
個人先說明一下,若干年前,原本微軟作128編碼時已經把各國各族文字"想辦法"納入.
結果"好像"不太夠才有後來的256,然後我也沒再追了!所以不清楚有沒有成功! :ase
只是您說的要全漢字體系,那是否日文韓文也要納入?
又要如何交叉運用表現同文不同意的問題?比如:勉強在中文是不樂意,日文是用功?
(有點忘記意思,反正日語韓語跟中文意思不同的同名詞很多啦!)
如果是這樣難度可能太高,真的是大數據AI等級才玩得起呀!
光漢字就這樣,他還要搞其他國甚至古語,因為語音助手也要進化!
那漫畫裡的超級電腦管理人類生活就實現了耶! :think:
只能默默支持了!我還蠻不期望這一天到來的! :think:
陪長輩去復健科,看了這麼多,我覺得人就是動物,乖乖的走乖乖的動,
放山雞就是比飼料雞健康! :D


我會用「正體中文」這個詞彙意思就是,在「底層」完全不思考也不去管 日文漢字 韓文漢字 中共規範的簡化字/繁體字 香港粵語白話字 越南喃字 (甚至unicode最新版所納入的 「美國漢字」)的存在,完全無視! 只管 正體中文漢字 而已,當然進入「系統的上層」之後(或著說,從終端機模式進入圖形介面「之後」)才開始做有容乃大的相容。
為什麼我會有這樣的想法? 就是跟"ASCII"學的嘛!
當然我會有心理準備,我這套想法(其實我也不是第一個這樣想的,也是很多年前參考了中研院的期刊文章,和臺灣民間興趣研究類型的「動態組字」,才開始累積相關概念的)會被某些進階電腦玩家一陣酸就是了!
然而根據過往的臺灣在地網路次文化討論串閱讀經驗,如果今天跟我有同樣概念論述的是「藏文」「阿拉伯文」、「日文五十音」等等各自的母文字使用者,他們用原文發表類似中研院期刊的概念文章,然後被臺灣熱心的人翻譯之後,臺灣在地的網路討論串「一定會出現」「外國的月亮比較圓」的類型論述,然後例如說,哇賽!這個世界在二進位硬體之上,有全新的系統軟體底層概念出現了(還是完全無視英文字母的),準備要脫離美國掌控了云云,然後掀起一波熱烈的網路討論。
臺灣就是有這種「外國的月亮比較圓」的討論文化,前一段日子的一則新聞範例,
有位美國白人,對於研究「甲骨文」非常有興趣,花費掉他個人的人生積蓄,來研究甲骨文並建立甲骨文資料庫網站,然後新聞下發的讀者留言討論串,把這位美國白人捧得跟什麼似的,再然後反批臺灣自己卻都沒有研究出像樣的東西。
我去看了這位美國白人號稱自費建立的甲骨文研究網站,我覺得真的只是「還好而已」,臺灣「早就有」做「甲骨文」研究了,做的都比美國白人的網站「還要更好」,
就是中華民國中央研究院的漢字構形資料庫專案的其中一部分。
中研院的漢字構形資料庫單機版,甚至可以透過一些文書處理操作小技巧把甲骨文的字形檔挖出來再利用!比美國白人網站上只是看一堆圖片檔還要實用多了,該單機版軟體也有英文版的。臺灣在地一堆網路鄉民「不知道」臺灣早就存在的研究專案,只會一窩蜂地看了新聞之後跟著捧老外!


所有的時間均為GMT +8。 現在的時間是12:00 PM.

vBulletin Version 3.0.1
powered_by_vbulletin 2026。