当前位置: 代码网 > 科技>人工智能>动态 > 开源 AI 大模型“洗牌”:阿里通义千问 Qwen2-72B 成“王者”,傲视 Meta Llama-3、微软 Phi-3 等群雄

开源 AI 大模型“洗牌”:阿里通义千问 Qwen2-72B 成“王者”,傲视 Meta Llama-3、微软 Phi-3 等群雄

2024年06月28日 动态 我要评论
Hugging Face 联合创始人兼首席执行 Clem Delangue 于 6 月 26 日在 X 平台发布推文,表示阿里云开源的通义千问(Qwen)指令微调模型 Qwen2-72B 在开源模型排行榜上荣登榜首。

6 月 28 日消息,hugging face 联合创始人兼首席执行 clem delangue 于 6 月 26 日在 x 平台发布推文,表示阿里云开源的通义千问(qwen)指令微调模型 qwen2-72b 在开源模型排行榜上荣登榜首。

hugging face 公布了全新的开源大语言模型排行榜,通过 300 片英伟达 h100 gpu,重新运行 mmlu-pro 等标准评估目前主流的大语言模型,并在其要点介绍中称 qwen2-72b 为“王者”,并表示中国的诸多开源模型在榜单上有一席之位。

他表示,为了提供全新的开源大模型排行榜,使用了 300 块 h100 对目前全球 100 多个主流开源大模型,例如,qwen2、llama-3、mixtral、phi-3 等,在 bbh、musr、mmlu-pro、gpqa 等基准测试集上进行了全新评估。

阿里巴巴开源的 qwen-2 72b 模型在激烈竞争中脱颖而出,不仅超越了科技巨头 meta 的 llama-3,还超越了法国知名大模型平台 mistralai 的 mixtral,成为了新的行业领军者。代码网援引官方博文附上榜单排行如下:

排名新的榜单排名
qwen/qwen2-72b-instruct
2meta-llama/meta-llama-3-70b-instruct
3microsoft/phi-3-medium-4k-instruct
401-ai/yi-1.5-34b-chat
5cohereforai/c4ai-command-r-plus
6abacusai/smaug-72b-v0.1
7qwen/qwen1.5-110b
8qwen/qwen1.5-110b-chat
9microsoft/phi-3-small-128k-instruct
1001-ai/yi-1.5-9b-chat
(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com