PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   七嘴八舌異言堂 (https://www.pcdvd.com.tw/forumdisplay.php?f=12)
-   -   是不是語言翻譯比下圍棋還難 (https://www.pcdvd.com.tw/showthread.php?t=1101019)

=風= 2016-03-18 02:34 PM

引用:
作者sclee
語言還有涉及文化習慣

人工智慧再利害也沒法得知語言背後的文化意義

美國隊長3最後一支預告片

最後一刻鋼鐵人喊了一個字underoos,蜘蛛人就跳出來

我想電腦再利害也不可能翻得出這個字代表的意思

人類都會誤解人類的意思

最簡單的情況
新聞記者每次報專業的3C科技
經常亂報
所以對電腦的要求翻譯
有達到新聞記者的程式即可

我雖然說要求正確
但一定不可能完全正確的

=風= 2016-03-18 02:37 PM

引用:
作者lobben
看甚麼類型,如果是技術文件,我覺得微軟的機器翻譯已經不錯了
(我還是習慣看原文XD)
文件 (https://technet.microsoft.com/zh-tw/library/security/dd492162(v=vs.110).aspx)

更正,這篇好像是英翻中 :laugh:

我猜,這個應該有經過人工的修改

Earlson 2016-03-18 02:40 PM

有錢就不難

等哪天機器人發展到需要全球通的時候

機器翻譯就會補強了

=風= 2016-03-18 02:55 PM

貼一個連我都看不懂的
長長長長長長長, 行行行行行行行。

解答如下
http://howardhu.pixnet.net/blog/pos...%A6%99%E5%B0%8D

lobben 2016-03-18 03:22 PM

引用:
作者sclee
是美國一間小孩穿的小褲褲品牌

小褲上印了很多卡通的圖像

鋼鐵人應該是取笑蜘蛛人穿的緊身衣就像小孩穿的underoos

他這樣喊是指"蜘蛛人你這個小屁孩快出來"


我有點懷疑這麼複雜的背後意義,電腦真有方法透過歸納學習翻得出來嗎?

要達到這個目的,可以用統計式的方法
例如很多訓練用文章 有出現underoos的前後文出現kids、children或屁孩之類詞彙的次數或某些演算法加權後分數最高...那程式在消歧義時就可以挑一個最接近的意思

micall.lee 2016-03-18 03:26 PM

引用:
作者lobben
要達到這個目的,可以用統計式的方法
例如很多訓練用文章 有出現underoos的前後文出現kids、children或屁孩之類詞彙的次數或某些演算法加權後分數最高...那程式在消歧義時就可以挑一個最接近的意思

基於統計的機器翻譯

https://en.wikipedia.org/wiki/Stati...ine_translation

http://www.statmt.org/

一些幫你找的延伸參考 :agree:

lobben 2016-03-18 03:33 PM

引用:
作者=風=
我猜,這個應該有經過人工的修改

如果是人工翻譯,微軟會寫此文章為人工翻譯

可以發現
如果是簡單的step by step教學指南、說明書,多半會用機器翻譯,因為字彙就那幾個,也沒有展現修辭的空間
如果是講一個理論或長一點的介紹,微軟就用人工翻譯了

所以只要機器還不能把莎士比亞的著作翻譯出來,譯者暫時還不會失業:D

sclee 2016-03-18 03:43 PM

引用:
作者lobben
要達到這個目的,可以用統計式的方法
例如很多訓練用文章 有出現underoos的前後文出現kids、children或屁孩之類詞彙的次數或某些演算法加權後分數最高...那程式在消歧義時就可以挑一個最接近的意思

你似乎還是不懂我要表達的意思

舉這個例子是因為翻譯的人看到鋼鐵人喊完這個英文字後,蜘蛛人跑出來

即使這個譯者並不了解美國文化或品牌

他可以透過網路搜索得到UNDEROOS是什麼東西的資訊,從而推論跟蜘蛛人的關係
可以譯出"穿小褲褲的快出來"

假設用電腦翻譯,分析資訊的技術很成熟

美國隊長3的中文翻譯全交給電腦來做

電腦不會去看電影知道什麼是蜘蛛人,他只會針對UNDEROOS這個字在這裡到底怎麼譯

zbhMbKvbKNXm 2016-03-18 04:02 PM

引用:
作者lobben
如果是人工翻譯,微軟會寫此文章為人工翻譯 (https://technet.microsoft.com/zh-tw...y/9127hsd2.aspx)

可以發現
如果是簡單的step by step教學指南、說明書,多半會用機器翻譯,因為字彙就那幾個,也沒有展現修辭的空間
如果是講一個理論或長一點的介紹,微軟就用人工翻譯了

所以只要機器還不能把莎士比亞的著作翻譯出來,譯者暫時還不會失業:D


莎士比亞的著作跟唐詩三百首那個比較難翻譯......


臥虎藏龍 跟 江湖 機器會怎麼翻?

lobben 2016-03-18 05:12 PM

引用:
作者sclee
你似乎還是不懂我要表達的意思

舉這個例子是因為翻譯的人看到鋼鐵人喊完這個英文字後,蜘蛛人跑出來

即使這個譯者並不了解美國文化或品牌

他可以透過網路搜索得到UNDEROOS是什麼東西的資訊,從而推論跟蜘蛛人的關係
可以譯出"穿小褲褲的快出來"

假設用電腦翻譯,分析資訊的技術很成熟

美國隊長3的中文翻譯全交給電腦來做

電腦不會去看電影知道什麼是蜘蛛人,他只會針對UNDEROOS這個字在這裡到底怎麼譯


是您說的沒錯
很多俚語也有類似的狀況
那可以透過設定領域字典的方式解決,算是半人工介入了
例如要把美國隊長3交給機器翻譯時,給它一個字典,設定參數與條件,讓程式知道甚麼時候要把 UNDEROOS 特定指稱蜘蛛人

如果沒有領域字典與參數幫忙
同樣的,機器很難知道Apple、蘋果甚麼情況場合該有甚麼意思 :D


所有的時間均為GMT +8。 現在的時間是02:08 AM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。