当前位置：代码网 > 科技>人工智能>机器学习 > 俄罗斯科技巨头 Yandex 宣布开源“YaFSDP”大语言模型训练工具：大幅提升 GPU 利用率，对 Llama 3 可实现 26% 加速

俄罗斯科技巨头 Yandex 宣布开源“YaFSDP”大语言模型训练工具：大幅提升 GPU 利用率，对 Llama 3 可实现 26% 加速

2024年06月12日 • 机器学习 •我要评论

俄罗斯科技巨头 Yandex 推出了一款开源的大语言模型训练工具 ——YaFSDP，号称与现有工具相比速度最高可提升 26%。

6 月 11 日消息，俄罗斯科技巨头 yandex 推出了一款开源的大语言模型训练工具 ——yafsdp，号称与现有工具相比速度最高可提升 26%。

俄罗斯科技巨头 yandex 宣布开源“yafsdp”大语言模型训练工具：大幅提升 gpu 利用率，对 llama 3 可实现 26% 加速

据介绍，yafsdp 在训练速度方面优于传统的 fsdp 方法，尤其适用于大型模型。在预训练 llm 方面，yafsdp 速度提高了 20%，并且在高内存压力条件下表现更佳。

例如，yafsdp 对具有 700 亿参数的 llama 2 可以实现 21% 的效率提升，对具有同级参数的 llama 3 也实现了 26% 的效率提升。代码网附官方数据一览：

模型	gpu-count	seq-len	num-ckpt-layers	speedup
llama 2 7b	64	2048	0	9.92%
llama 2 7b	64	4096	0	3.43%
llama 2 7b	64	8192	0	2.68%
llama 2 7b	128	2048	0	9.57%
llama 2 7b	128	4096	0	2.42%
llama 2 7b	128	8192	0	2.32%
llama 2 13b	128	2048	0	12.10%
llama 2 13b	128	4096	0	3.49%
llama 2 34b	128	2048	0	20.70%
llama 2 34b	256	2048	0	21.99%
llama 2 34b	256	4096	5	8.35%
llama 2 70b	256	2048	10	21.48%
llama 2 70b	256	4096	50	7.17%
llama 3 8b	64	2048	0	11.91%
llama 3 8b	64	4096	0	7.86%
llama 3 70b	256	2048	20	26.60%

yandex 表示，通过优化 gpu 使用率，yafsdp 可以为开发者和公司节省大量资金 —— 每月可能节省数十万美元。

yandex 的资深开发人员、yafsdp 团队成员之一 mikhail khruschev 还提到，“目前，我们正在积极尝试各种模型架构和参数大小，以扩展 yafsdp 的通用性” 。

参考资料：

赞 (0)

相关文章:

全国首个司法审判垂直领域 AI 大模型在深圳市中级人民法院上线运行

据“面壁智能”官方公众号，由该公司助力的全国首个司法审判垂直领域大模型问世，AI辅助审判系统昨日在深圳市中级人民法院上线运行。 [阅读全文]
国内首个住房城乡建设部全屋智能重点实验室揭牌：华为全屋智能推动空间智能化时代更进一步

在本届住博会的“数字赋能好房子建设技术研讨会”上，隆重举行了“住房和城乡建设部全屋智能重点实验室”揭牌仪式 [阅读全文]
帮你把草图变成完整画作，三星 One UI 6.1.1 引入“手稿到图像”等 AI 功能

用户可预先在手机上使用S-Pen或徒手绘制草图，Galaxy AI就会通过AI和机器学习创建图形元素，使草图与周边的图像或背景相匹配。 [阅读全文]
“云计算一哥”亚马逊深夜放大招：几分钟纯靠 Prompt 打造一个 App

现在开发一个 APP 需要多久？“云计算一哥”亚马逊云科技，深夜给出了一个新标准 ——只需三步，几分钟，纯靠自然语言和鼠标“点点点”即可。…

2024年07月13日 • 人工智能
Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具：细化提示词、增强评估和测试

Anthropic 公司昨日（7 月 10 日）发布新闻稿，宣布推出了多项新工具，简化和自动化 Claude 3.5 Sonnet 大语言模型的提示（prompt）流程。…

2024年07月13日 • 人工智能
深入理解TensorFlow底层架构

通过深入了解TensorFlow的底层架构，我们可以更加高效地构建和运行复杂的机器学习模型。TensorFlow的灵活性和强大的分布式计算能力使其成为研究和工业... [阅读全文]

版权声明：本文内容由互联网用户贡献，该文观点仅代表作者本人。本站仅提供信息存储服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 2386932994@qq.com 举报，一经查实将立刻删除。

发表评论


验证码：

Copyright © 2017-2025 代码网保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱：2386932994@qq.com