7 月 5 日消息,在 2024 世界人工智能大会(waic 2024)上,哔哩哔哩(以下简称“b站”)公布了多项自主研发的 ai 技术成果和 aigc 多元创意,包括最新定制的 ai 语音声库、自研音视频大模型必剪 studio 以及自研 ai 动态漫技术等。
此外,b站自研的大语言模型系列也在此次 waic 2024 大会上首次展出,包括开源的 index-1.9b chat 和 index-1.9b character 两个模型。
代码网查询 github 获悉,index-1.9b 系列模型于 6 月开源,包含基座模型、对照组、对话模型、角色扮演模型:
index-1.9b base : 基座模型,具有 19 亿非词嵌入参数量,在 2.8t 中英文为主的语料上预训练,多个评测基准上与同级别模型比处于领先
index-1.9b pure : 基座模型的对照组,与 base 具有相同的参数和训练策略,不同之处在于过滤了该版本语料中所有指令相关的数据,以此来验证指令对 benchmark 的影响
index-1.9b chat : 基于 index-1.9b base 通过 sft 和 dpo 对齐后的对话模型
index-1.9b character : 在 sft 和 dpo 的基础上引入了 rag 来实现 fewshots 角色扮演定制
在b站 15 周年演讲上,b站董事长兼 ceo 陈睿表示,2023 年,b站 ai 相关内容的日均视频播放量同比增长超过 80%,爆款内容涵盖科普资讯、ai 技术应用、数字人和创意应用等领域。
根据b站透露的数据,当前超过 8000 万用户每月在b站观看 ai 相关的视频,其中 6 成为 00 后。
index-1.9b 系列模型开源地址:
发表评论