当前位置: 代码网 > 科技>人工智能 > 《自然》杂志研究:AI 追踪他人心理状态能力与人类相当或超越人类

《自然》杂志研究:AI 追踪他人心理状态能力与人类相当或超越人类

2024年05月27日 人工智能 我要评论
结果显示,GPT模型在识别间接要求、错误想法和误导的表现能达到有时甚至超越人类平均水平,而LLaMA2的表现逊于人类水平;在识别失礼方面,LLaMA2强于人类,但GPT表现不佳。

5 月 25 日消息,在本月下旬最新一期的《自然-人类行为》期刊上,刊登了一篇关于 ai 的研究论文,其中提到,在测试追踪他人心理状态能力的任务中,两类 ai 大语言模型在特定情况下,具备与人类相似甚至超越人类的表现。

图源 pixabay

作为人类沟通交流、产生共鸣的关键,心理状态能力(也称心智理论)对人类的社交互动来说非常重要。该论文的第一作者 —— 德国汉堡-埃彭多夫大学医学中心的 james w. a. strachan 与同事及合作者一起,选择能测试心理理论不同方面的任务,包括发现错误想法、理解间接言语以及识别失礼等

代码网注:该团队选用了 gpt 和 llama2 模型进行试验,并与 1907 人进行对比。

结果显示,gpt 模型在识别间接要求、错误想法和误导的表现能达到有时甚至超越人类平均水平,而 llama2 的表现逊于人类水平;在识别失礼方面,llama2 强于人类,但 gpt 表现不佳。

据中新社报道,该作者表示,llama2 的成功被证明是因为回答“偏见程度”较低,并非真的对失礼敏感,gpt“表现不佳”则是因为对坚持结论具有“超保守”的态度,而非推理错误。

代码网附论文地址:《testing theory of mind in large language models and humans

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com