显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了_硬件其它

上海交大、上海ai lab和港中文大学的研究人员推出visual-rft（视觉强化微调）开源项目，该项目仅需少量数据即可显著提升视觉语言大模型（lvlm）性能。visual-rft巧妙地将deepseek-r1的基于规则奖励的强化学习方法与openai的强化微调（rft）范式相结合，成功地将这一方法从文本领域扩展到视觉领域。

显著超越 sft，o1/deepseek-r1 背后秘诀也能用于多模态大模型了

通过为视觉细分类、目标检测等任务设计相应的规则奖励，visual-rft克服了deepseek-r1方法仅限于文本、数学推理等领域的局限性，为lvlm训练提供了新的途径。

显著超越 sft，o1/deepseek-r1 背后秘诀也能用于多模态大模型了

visual-rft的优势：

与传统的视觉指令微调（sft）方法相比，visual-rft具有以下显著优势：

少样本学习能力: 仅需10到1000条数据即可实现有效微调。
更强的泛化性: 在数据有限的场景下，性能优于sft。

研究人员在多个视觉感知任务（检测、分类、定位等）上对visual-rft进行了验证，结果表明，即使在开放词汇和少样本学习的设定下，visual-rft也能取得显著的性能提升，轻松实现能力迁移。

显著超越 sft，o1/deepseek-r1 背后秘诀也能用于多模态大模型了

研究人员针对不同的任务设计了相应的可验证奖励：基于iou的奖励用于检测和定位任务，基于分类正确性的奖励用于分类任务。

显著超越 sft，o1/deepseek-r1 背后秘诀也能用于多模态大模型了

在推理定位任务中，visual-rft展现出强大的视觉推理能力，例如，准确识别图片中运动员需要佩戴的防水眼镜。

显著超越 sft，o1/deepseek-r1 背后秘诀也能用于多模态大模型了

实验结果:

基于qwen2-vl 2b/7b模型进行的实验表明，visual-rft在开放目标检测、少样本检测、细粒度分类和推理定位任务上均优于sft。即使是检测特定动漫角色（例如史莱姆），visual-rft也只需少量数据即可实现。

显著超越 sft，o1/deepseek-r1 背后秘诀也能用于多模态大模型了

开源信息:

visual-rft项目已开源，包含训练、评测代码和数据。

项目地址：https://www.php.cn/link/b2c1a4c8e4f9c3f8efe19a903a005149

显著超越 sft，o1/deepseek-r1 背后秘诀也能用于多模态大模型了

以上就是显著超越 sft，o1/deepseek-r1 背后秘诀也能用于多模态大模型了的详细内容，更多请关注代码网其它相关文章！

问界 M8/ 新 M9 合计 1 小时小订突破 1.1 万台预售 36.8 万起

3月6日，鸿蒙智行旗下问界m8和新款m9两款高端suv正式开启预售，并迅速公布了令人瞩目的预订成绩。官方数据显示，问界m8在预售一小时内小订数量突破7500台，... [阅读全文]

主流玩家再一次狂欢：七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB评测

七彩虹igame geforce rtx 5070 ultra w oc 12gb显卡评测：dlss 4加持下的2k游戏利器继rtx 50系列高端显卡发布后，更亲民的rtx 507…

2025年03月31日 • 硬件开发

机械键盘轴体更换与清洁维护教程

本文介绍了机械键盘轴体更换与清洁维护方法。1. 准备工作：新轴体、镊子、拔键器、螺丝刀、清洁工具及舒适环境；2. 更换步骤：小心拔出旧轴体，注意新轴体方向，轻轻... [阅读全文]

你正在做的大模型评测，可能有一半都是无用功

多模态ai模型评估：冗余测试的系统性分析近期，上海ai lab、上海交大和浙江大学的研究团队发现，当前流行的多模态大模型基准测试存在大量冗余。该团队对20多个主... [阅读全文]

三星电子强化半导体布局董事会多名半导体专家入选

三星电子第56届股东大会圆满落幕，所有议案顺利通过。此次大会尤其注重董事会重组，尤其是在半导体领域专家的引进上，展现了三星在应对去年核心产品失误后，重振技术实力... [阅读全文]

2024 年全球扫地机器人出货量排名：石头小米进前五

2024年全球智能扫地机器人市场蓬勃发展，idc最新报告显示强劲增长态势。报告指出，2024年全球智能扫地机器人出货量达2060.3万台，同比增长11.2%，销... [阅读全文]


验证码：

验证码：

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

2025年03月31日 • 硬件其它 •我要评论

相关文章:

主流玩家再一次狂欢：七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB评测

发表评论