谷歌 DeepMind 新研究：利用 AI 模型为无声视频配音_动态

6 月 18 日消息，据谷歌 deepmind 新闻稿，deepmind 近日公布了一项利用 ai 为无声视频生成背景音乐的“video-to-audio”技术。

代码网获悉，当前 deepmind 这款 ai 模型依然存在局限性，需要开发者使用提示词为模型预先“介绍”视频可能的声音，暂时不能直接根据视频画面添加具体音效。

据悉，该模型首先会将用户输入的视频进行拆解，此后结合用户的用户文字提示，利用扩散模型反复运算，最终以生成与视频画面协调的背景声音，例如输入一条“在黑暗中行走”的无声视频，再添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文字提示，相关模型就能生成恐怖风格的背景音效。

谷歌 deepmind 新研究：利用 ai 模型为无声视频配音

deepmind 同时表示，该“video-to-audio”模型可以为任何视频生成无限数量的音轨，还能够通过提示词内容判断生成的音频“正向性”或“反向性”，从而令生成的声音更贴近某些特定场景。

展望未来，deepmind 表示研究人员正进一步优化这款“video-to-audio”模型，计划未来能够让模型直接根据视频内容，无须通过提示词即可生成视频背景音，同时还将改善视频中人物对白的口型同步能力。

中国信通院正式启动首轮代码大模型安全风险防范能力试评估工作，报名将于 8 月底截止，预计年底发布评估结果。 [阅读全文]

数据显示，我国人工智能企业数量已经超过4000家，人工智能已成为新一轮科技革命和产业变革的重要驱动力量和战略性技术。 [阅读全文]

花旗银行表示，AI取代银行业工作岗位的数量可能超过其他任何行业，因为AI将在金融层面颠覆消费者，并提高员工工作效率。与此同时，银行业还将有12%岗位通过AI得到... [阅读全文]

该剧第一季共 12 集，由抖音联合出品，将在抖音短剧暑期档播出。即梦 AI 作为首席 AI 技术支持方，基于豆包大模型技术，为《三星堆：未来启示录》提供了 AI... [阅读全文]

作为计划的一部分，亚马逊将为 80 家使用生成式 AI 解决复杂挑战的创企提供十周系统性指导。 [阅读全文]

绿米 Aqara 今晚正式发布新品繁星妙控旋钮 V1，搭载 3D 无极旋钮，使用线性马达特调震感反馈，旋钮最小识别角度可达 0.07°，线下开启预售。…

2024年06月18日 • 人工智能


验证码：

验证码：

谷歌 DeepMind 新研究：利用 AI 模型为无声视频配音