“全球首创”单台 RTX 4090 服务器推理，昆仑万维开源 2 千亿稀疏大模型天工 MoE_机器学习

6 月 3 日消息，昆仑万维今日宣布开源 2 千亿稀疏大模型 skywork-moe，基于之前昆仑万维开源的 skywork-13b 模型中间 checkpoint 扩展而来，号称是首个完整将 moe upcycling 技术应用并落地的开源千亿 moe 大模型，也是首个支持用单台 rtx 4090 服务器（8 张 rtx 4090 显卡）推理的开源千亿 moe 大模型。

据介绍，本次开源的 skywork-moe 模型隶属于天工 3.0 的研发模型系列，是其中的中档大小模型（skywork-moe-medium），模型的总参数量为 146b，激活参数量 22b，共有 16 个 expert，每个 expert 大小为 13b，每次激活其中的 2 个 expert。

天工 3.0 还训练了 75b （skywork-moe-small）和 400b （skywork-moe-large）两档 moe 模型，并不在此次开源之列。

根据官方测试，在相同的激活参数量 20b（推理计算量）下，skywork-moe 能力接近 70b 的 dense 模型，使得模型的推理成本有近 3 倍的下降。同时 skywork-moe 的总参数大小比 deepseekv2 的总参数大小要小 1/3，用更小的参数规模做到了相近的能力。

skywork-moe 的模型权重、技术报告完全开源，免费商用，无需申请，代码网附链接如下：

模型权重下载：

https://huggingface.co/skywork/skywork-moe-base

https://huggingface.co/skywork/skywork-moe-base-fp8

模型开源仓库：https://github.com/skyworkai/skywork-moe
模型技术报告：https://github.com/skyworkai/skywork-moe/blob/main/skywork-moe-tech-report.pdf
模型推理代码：（支持 8 x 4090 服务器上 8 bit 量化加载推理） https://github.com/skyworkai/vllm

全国首个司法审判垂直领域 AI 大模型在深圳市中级人民法院上线运行

据“面壁智能”官方公众号，由该公司助力的全国首个司法审判垂直领域大模型问世，AI辅助审判系统昨日在深圳市中级人民法院上线运行。 [阅读全文]

国内首个住房城乡建设部全屋智能重点实验室揭牌：华为全屋智能推动空间智能化时代更进一步

在本届住博会的“数字赋能好房子建设技术研讨会”上，隆重举行了“住房和城乡建设部全屋智能重点实验室”揭牌仪式 [阅读全文]

帮你把草图变成完整画作，三星 One UI 6.1.1 引入“手稿到图像”等 AI 功能

用户可预先在手机上使用S-Pen或徒手绘制草图，Galaxy AI就会通过AI和机器学习创建图形元素，使草图与周边的图像或背景相匹配。 [阅读全文]

“云计算一哥”亚马逊深夜放大招：几分钟纯靠 Prompt 打造一个 App

现在开发一个 APP 需要多久？“云计算一哥”亚马逊云科技，深夜给出了一个新标准 ——只需三步，几分钟，纯靠自然语言和鼠标“点点点”即可。…

2024年07月13日 • 人工智能

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具：细化提示词、增强评估和测试

Anthropic 公司昨日（7 月 10 日）发布新闻稿，宣布推出了多项新工具，简化和自动化 Claude 3.5 Sonnet 大语言模型的提示（prompt）流程。…

2024年07月13日 • 人工智能

深入理解TensorFlow底层架构

通过深入了解TensorFlow的底层架构，我们可以更加高效地构建和运行复杂的机器学习模型。TensorFlow的灵活性和强大的分布式计算能力使其成为研究和工业... [阅读全文]


验证码：

验证码：

“全球首创”单台 RTX 4090 服务器推理，昆仑万维开源 2 千亿稀疏大模型天工 MoE

2024年06月04日 • 机器学习 •我要评论

相关文章:

“云计算一哥”亚马逊深夜放大招：几分钟纯靠 Prompt 打造一个 App

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具：细化提示词、增强评估和测试

发表评论