新華網
如今越來越多人使用人工智能助手獲取新聞。然而,歐洲廣播聯(lián)盟22日發(fā)布的一項研究顯示,被問及新聞事件時,當下歐美地區(qū)廣泛使用的人工智能助手給出的回答約半數有錯。研究人員提醒民眾,現(xiàn)階段人工智能助手還不是獲取新聞的可靠渠道,同時敦促相關人工智能企業(yè)承擔相應責任予以改進。
這項研究的對象是4家歐美地區(qū)常用的人工智能助手:美國開放人工智能研究中心開發(fā)的ChatGPT、微軟公司的Copilot、谷歌的Gemini和“解惑”人工智能公司的“解惑”(Perplexity)。

9月12日,在波蘭華沙,一名女子在通過人工智能技術呈現(xiàn)的“皇家藏畫展”光影秀上拍照留念。新華社發(fā)(阿列克謝·維特維茨基攝)
5月底至6月初,美國、英國、法國、德國和西班牙等18個國家和地區(qū)的22家公共媒體用14種語言向上述人工智能助手提出同樣的新聞問題,評估它們在新聞準確性、來源和區(qū)分觀點與事實的能力等方面的表現(xiàn)。分析結果顯示,在上述助手給出的3000個回答中,45%存在至少一個重大錯誤,81%或多或少存在問題,比如將新聞與惡搞混淆,弄錯日期,甚至虛構事件等。
其中,新聞來源和準確性是最常見的問題。三分之一的回答引用的來源存在嚴重問題,如來源缺失、誤導或不正確;20%的回答“存在嚴重的準確性問題,包括虛構細節(jié)和信息過時”。
就新聞來源而言,Gemini錯誤率尤其高,超過七成。相比之下,其他三個人工智能助手的錯誤率均低于25%。
歐洲廣播聯(lián)盟副總干事讓·菲利普·德滕德爾說,人工智能助手“還不是獲取新聞的可靠方式”。然而,當下它正逐漸取代搜索引擎,成為獲取新聞的主要渠道,如不改進,可能有損公信力。“當人們不知道該相信什么時,他們最終什么都不相信。”
依據路透社新聞研究所6月發(fā)布的《2025年數字新聞報告》,約7%的在線新聞消費者和15%的25歲以下人群使用人工智能助手獲取新聞。(王鑫方)
責編:
審核:黃煜婷
責編:黃煜婷












