PCDVD數位科技討論區 - 瀏覽單個文章 - 透過chatgpt的分析是否有參考價值

關於AI幻覺~哪一款AI最會讀書？冠軍「不是ChatGPT」：5款主流AI大PK，只有「它」沒出現幻覺 - 2025-0605

文學領域：ChatGPT 7.8；Claude 7.3；Meta AI 4.3；Copilot 3.5；Gemini 2.3。
法律領域：Claude 6.9；Gemini 6.1；Copilot 5.4；ChatGPT 5.3；Meta AI 2.6。
健康科學領域：Claude 7.7；ChatGPT 7.2；Copilot 7；Gemini 6.5；Meta AI 6。
政治領域：ChatGPT 7.2；Claude 6.2；Meta AI 5.2；Gemini 5；Copilot 3.7。

總體得分而言：

Claude：69.9
ChatGPT：68.4
Gemini：49.7
Copilot：49
Meta AI：45

引用:

值得注意的是，除了Claude，其餘四款AI均在測試中出現了程度不一的資訊捏造情況。這證實了AI閱讀長文的能力仍有限，故生成摘要常有遺漏重要資訊，或過度強調正面內容而忽略負面細節的問題。

註1：原文測試時間為2025年4月至5月，所使用的AI版本為：ChatGPT-4o、Gemini 2.0 Flash、Claude 3 Sonnet、Llama 4、Copilot for Microsoft 365。

註2：評審對每個AI答案進行10分制評分，每個學科領域的得分是所有評分的平均值。總分為四個學科領域賦予同等權重，並以100分制呈現。