Stable Audio Open 开源 AI 模型发布：48.6 万个样本训练，可创建 47 秒短音频 / 音效等_人工智能

6 月 6 日消息，stability ai 立足 stable diffusion 文生图模型，进一步向音频领域拓展，推出了 stable audio open，可以基于用户输入的提示词，生成高质量音频样本。

stable audio open 开源 ai 模型发布：48.6 万个样本训练，可创建 47 秒短音频 / 音效等

stable audio open 最长可以创建 47 秒的音乐，非常适合鼓点、乐器旋律、环境音和拟声音效，该开源模型基于 transforms 扩散模型（dit），在自动编码器的潜在空间中操作，提高生成音频的质量和多样性。

stable audio open 目前已经开源，代码网附上相关链接，感兴趣的用户可以在 huggingface 上试用。据说它使用了来自 freesound 和 free music archive 等音乐库的 486000 多种采样进行训练。

stability ai 公司表示：“虽然它可以生成简短的音乐片段，但并不适合完整的歌曲、旋律或人声”。

stable audio open 和 stable audio 2.0 不同是，前者为开源模型，专注于短音频片段和音效，而后者能够生成最长 3 分钟的完整音频。

据悉，此次破获的案件具备新颖的作案手法，涉案团伙利用“三板斧”绕过了芯片信用卡预设的安全防线。 [阅读全文]

据新浪科技，近日有媒体报道称字节跳动“已于两个月前秘密启动”AI手机研发项目。字节跳动相关人士称：信息不实，目前并没有自己做手机并销售的计划。 [阅读全文]

苹果一出手，在手机等移动设备上部署大模型不可避免地成为行业关注焦点。然而，目前在移动设备上运行的模型相对较小（苹果的是 3B，谷歌的是 2B），并且消耗大量内存，这在很大程度上限制…

2024年06月12日 • 人工智能

一位业内人士表示：“在 OpenAI 与苹果公司签署合作伙伴关系协议后，阿尔特曼会见了李在镕，看来他决心继续与三星进行牢固的合作，而不管与苹果公司的关系如何。” [阅读全文]

Anthropic 的 25 岁参谋长自曝因为深感 AGI，未来三年自己的工作将被 AI 取代。她在最近的一篇文章中预言了未来即将要被淘汰的工种。难道说，Claude 3 模型已经…

2024年06月03日 • 人工智能

ElevenLabs 此前已推出利用人工智能生成人类声音和音乐的工具，现在他们更进一步，推出了可以为播客、电影或游戏创作音效的工具。ElevenLabs 的名为... [阅读全文]


验证码：

验证码：

Stable Audio Open 开源 AI 模型发布：48.6 万个样本训练，可创建 47 秒短音频 / 音效等