瀏覽單個文章
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
資料彙整過程中的一些雜感,目前還在彙整資料中,還是有一些瓶頸在,目前卡住中。
一直搞不定在純LibreOffice DRAW/IMPRESS編製環境的限定條件下的筆順動畫繪製的部分,只好先擺一邊。
(根據過往的網路討論串經驗,我個人的推論是現階段理論上一定已經做得到,只不過「被留一手」)
先看看能不能搞定語音檔的彙整好了。我找到了
中華民國(臺灣)教育部 國語辭典公眾授權網
https://resources.publicense.moe.edu.tw
把累積幾十GB的國語辭典資料檔下載下來,並從中挑選出我需要的那五千九百多個常用與次常用字的語音檔。
然後我發現,這堆語音檔的聲音品質非常的「不穩定」,有的是勘聽,有的明顯聽來錄影品質很差,有的語音人聲還算自然清晰,有的則聽來刻意做作音感聽來很怪,整套語音檔一路聽下來,「沒有」一致性,很明顯的就是斷斷續續錄出來的,而且錄音品質也不一致。
我開始傷腦筋我該怎麼去彙整這些語音檔,我無法自己錄,我是男聲,語音檔是女聲。

後來我又找到了,
中華民國(臺灣)教育部 常用國字標準字體筆順學習網
http://stroke-order.learningweb.moe.edu.tw/
這個網站的語音檔一路聽下來,聲音品質就相對一致,
可惜的是這個網站的範例國字只有4808個。
然後我透過瀏覽器的查閱原始碼功能發現語音檔呈現會類似這樣,
stroke-order.learningweb.moe.edu.tw/sound/X.mp3
然而mp3主檔名好象也沒完全有一定的規則,我的軟體進階應用技術能力不足,
我無法把
stroke-order.learningweb.moe.edu.tw/sound/X.mp3
「所有的」國字語音檔(也要包含注音符號本身的語音檔)全部一口氣批次下載下來。
土法煉鋼一個一個檔案下載真的會很苦勞!
舊 2019-05-01, 11:22 PM #36
回應時引用此文章
FLYFLY4離線中