当前位置: 代码网 > 科技>人工智能>智能机器人 > B站开源轻量级 Index-1.9B 系列模型:2.8T 训练数据,支持角色扮演

B站开源轻量级 Index-1.9B 系列模型:2.8T 训练数据,支持角色扮演

2024年06月20日 智能机器人 我要评论
B站昨日开源了轻量级Index-1.9B系列模型,包含基座模型、对照组、对话模型、角色扮演模型等多个版本。

6 月 20 日消息,b站昨日开源了轻量级 index-1.9b 系列模型,包含基座模型、对照组、对话模型、角色扮演模型等多个版本。

代码网附官方简介:

  • index-1.9b base : 基座模型,具有 19 亿非词嵌入参数量,在 2.8t 中英文为主的语料上预训练,多个评测基准上与同级别模型比处于领先。

  • index-1.9b pure : 基座模型的对照组,与 base 具有相同的参数和训练策略,不同之处在于严格过滤了该版本语料中所有指令相关的数据,以此来验证指令对 benchmark 的影响。

  • index-1.9b chat :基于 index-1.9b base 通过 sft 和 dpo 对齐后的对话模型,由于预训练中引入了较多互联网社区语料,聊天的趣味性明显更强。

  • index-1.9b character :在 sft 和 dpo 的基础上引入了 rag 来实现 fewshots 角色扮演定制。

据介绍,该模型在预训练阶段使用了 2.8t 规模的数据,中英比例为 4:5,代码占比 6%。目前,角色扮演模型内置了角色“三三”,用户也可以按需创建自己的角色。

项目地址:https://github.com/bilibili/index-1.9b/blob/main/readme.md

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com