solidot新版网站常见问题,请点击这里查看。

研究人员评估大模型识别假新闻的能力

人工智能
Wilson (42865)发表于 2023年07月17日 23时01分 星期一

来自遥远地球之歌
威斯康星大学斯托特分校的研究员 Kevin Matthe Caramancion 评估了流行大语言模型识别假新闻的能力。他评估了四个大模型,包括 Open AI 的 Chat GPT-3.0 和 Chat GPT-4.0,Google 的 Bard/LaMDA 以及微软的 Bing AI。他向这些模式输入了已经过人类事实核查的新闻。结果显示,OpenAI 的 GPT-4.0 表现最出色。但所有四种大模型都落后于人类事实核查人员,突出了人类认知的不可替代价值。研究报告发表在预印本平台 arxiv 上。


https://techxplore.com/news/2023-07-ability-chatgpt-large-language-fake.html
https://arxiv.org/abs/2306.17176