当前位置: 代码网 > 科技>人工智能>智能机器人 > 专给 ChatGPT“找茬”,OpenAI 训练 CriticGPT 模型以检索输出内容错误

专给 ChatGPT“找茬”,OpenAI 训练 CriticGPT 模型以检索输出内容错误

2024年06月28日 智能机器人 我要评论
当地时间27日,OpenAI宣布基于GPT-4训练了一个名为CriticGPT的模型,用于查找ChatGPT聊天机器人输出内容中的错误。它可以撰写评论,强调 ChatGPT 生成答案中不准确的地方。

6 月 28 日消息,当地时间 27 日,openai 宣布基于 gpt-4 训练了一个名为 criticgpt 的模型,用于查找 chatgpt 聊天机器人输出内容中的错误。它可以撰写评论,强调 chatgpt 生成答案中不准确的地方。

据介绍,criticgpt 旨在协助人类 ai 训练员完成工作 —— 使用一种名为“从人类反馈中强化学习(代码网注:reinforcement learning from human feedback,rlhf)”的技术来训练、改进 gpt-4 的回答。

然而随着 chatgpt 的准确性日益提升,错误越来越隐蔽,导致 ai 训练员的工作越来越“难做”。openai 对此解释称,这是 rlhf 的基本局限之一 —— 模型逐渐变得比任何可以提供反馈的人都更博学,模型的协调可能也会随之变得越来越困难。

目前,当 criticgpt 试图从 chatgpt 的回答中发现错误时,它的一双“鹰眼”就会发挥作用。openai 指出,现实世界中的错误可能遍布答案的多个部分,这是 criticgpt 未来需要解决的问题。“我们的工作重点是可以在一个地方指出错误,但将来我们也需要解决分散的错误。”

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com