PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 其他群組 > 七嘴八舌異言堂
帳戶
密碼
 

回應
 
主題工具
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
關於中文詞庫檔的詞彙挑選和再整合的問題

這個問題描述起來可能會有些落落長,有問有機會!
這裡有一個範本檔
正體中文詞庫OpenVanilla
https://sites.google.com/site/ianho...sociatedphrases
裡頭的內容就是把中華民國教育部的國語辭典網站群的現有資料檔,再整理出十五萬多的中文詞條列在一個純文字檔案內。我想嘗試以這個檔案內的中文詞條為基礎,再做一種詞彙再整理。
就是把「連續兩個字」的詞彙,全部都挑出來,然後做「連續四個字」為一組的「既有詞條」的「文字接龍」。

文字接龍條件範例:
「會心一笑置之不理」(能夠接越多越好)
就是 會心一笑、一笑置之、置之不理
這些國語辭典內的既有詞條的文字接龍。

我之前已經嘗試過把五千九百多個常用和部份次常用的國字,經過我土法煉鋼的手動挑選,做到「某種程度」的「連續兩個字」的「文字接龍」。
成果在這裡
https://sites.google.com/site/ianho...ty_reproduction
(要看 直式/竪式 的方向)
然而當我遭遇到十五萬多的中文詞條,我確定我「沒有能力」土法煉鋼的手動調整挑選詞彙來文字接龍。
於是我就在想,目前現有的圖形介面文書軟體工具,例如進階純文字編輯器的 TextWrangler.app 、 試算表的 LibreOffice Calc 有沒有辦法幫助我做相對有效率的資料再整理?
但是這兩款軟體我自己嘗試老半天,我試不出符合我需求的資料編輯流程。
我也試不出能夠google出符合我的編輯需求的資訊的適當關鍵字組合。
所以發文有問有機會!既有的圖形介面的試算表軟體和進階純文字編輯器,有沒有什麼樣的「操作流程」,能夠完成我的文件編輯需求?或者能輔助我編輯到一某個程度,剩下的我再自己想辦法土法煉鋼手動挑詞?
我相信這十五萬多的教育部國語辭典既有詞條,一定能夠排出有趣且夠長的文字接龍。
我會希望在既有圖形介面工具操作的前提下搞定。
盡量避免用到終端機下指令和執行指令串批次檔。
     
      
舊 2019-09-15, 12:45 AM #1
回應時引用此文章
FLYFLY4離線中  


回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是02:05 PM.


vBulletin Version 3.0.1
powered_by_vbulletin 2025。