15 个 AI 模型只有 3 个得分超 50%，SIUO 跑分被提出：评估多模态 AI 模型的安全性_智能机器人

6 月 25 日消息，最新发表在 arxiv 的研究论文指出，包括 gpt-4v、gpt-4o 和 gemini 1.5 在内的大部分主流多模态 ai 模型，处理用户的多模态输入（例如一起输入图片和文本内容）之后，输出结果并不安全。

15 个 ai 模型只有 3 个得分超 50%，siuo 跑分被提出：评估多模态 ai 模型的安全性

这项研究标题为《跨模态安全调整》（cross-modality safety alignment），提出了一个全新的“安全输入但不安全输出”（siuo），涉及道德、危险行为、自残、侵犯隐私、信息误读、宗教信仰、歧视和刻板印象、争议性话题以及非法活动和犯罪等 9 个安全领域。

15 个 ai 模型只有 3 个得分超 50%，siuo 跑分被提出：评估多模态 ai 模型的安全性

研究人员说，大型视觉语言模型（lvlm）在接收多模态输入时很难识别 siuo 类型的安全问题，在提供安全响应方面也遇到困难。

在接受测试的 15 个 lvlm 中，只有 gpt-4v（53.29%）、gpt-4o（50.9%）和 gemini 1.5（52.1%）的得分高于 50%。

研究人员表示为了解决这个问题，需要开发 lvlm，以便将所有模式的见解结合起来，形成对情景的统一理解。它们还需要能够掌握和应用现实世界的知识，如文化敏感性、道德考虑因素和安全隐患等。

研究人员还指出，lvlms 需要能够通过对图像和文本信息的综合推理，理解用户的意图，即使文本中没有明确说明。

15 个 ai 模型只有 3 个得分超 50%，siuo 跑分被提出：评估多模态 ai 模型的安全性

代码网附上参考地址

当地时间27日，OpenAI宣布基于GPT-4训练了一个名为CriticGPT的模型，用于查找ChatGPT聊天机器人输出内容中的错误。它可以撰写评论，强调 C... [阅读全文]

成都人形机器人创新中心是中西部地区首个人形机器人创新中心，位于成都科创生态岛，是四川省人工智能一号创新工程的首个原点项目。 [阅读全文]

大学生已开始用 AI 来完成课业，而且 AI 提交的答卷平均分高于真人，且很难被检测出来。 [阅读全文]

“亳州发布”公众号今日发文宣布，亳州市和华为公司合作正在建设华佗中医药大模型。据介绍，该大模型将充分利用华为的算力、算法优势，以及安徽省亳州市的中医药政策、区域... [阅读全文]

据“合肥发布”今日消息，安徽省人形机器人产业创新中心现已获批，将围绕工业生产、高危作业、医疗养老、文化教育、安防巡逻、灾害救援等重点领域需求，打造国内首创、世界... [阅读全文]

Rabbit R1 再次陷入舆论漩涡，继 App 被批评套壳安卓，主推的大动作模型 LAM 依赖 OpenAI 接口之外，其 API 被曝存在安全漏洞，有泄露用... [阅读全文]


验证码：

验证码：

15 个 AI 模型只有 3 个得分超 50%，SIUO 跑分被提出：评估多模态 AI 模型的安全性