当前位置：代码网 > 科技>人工智能>智能机器人 > AI 根据声音内容帮照片“对口型”，蚂蚁集团开源 EchoMimic 项目

AI 根据声音内容帮照片“对口型”，蚂蚁集团开源 EchoMimic 项目

2024年07月13日 • 智能机器人 •我要评论

该项目具备较高的稳定性和自然度，融合音频和面部标志点（面部关键特征和结构，通常位于眼、鼻、嘴等位置）的特征，可生成更符合真实面部运动和表情变化的视频。

7 月 11 日消息，蚂蚁集团 10 日开源了名为 echomimic 的新项目，其能够通过人像面部特征和音频来帮人物“对口型”，结合面部标志点和音频内容生成较为稳定、自然的视频。

ai 根据声音内容帮照片“对口型”，蚂蚁集团开源 echomimic 项目

该项目具备较高的稳定性和自然度，通过融合音频和面部标志点（面部关键特征和结构，通常位于眼、鼻、嘴等位置）的特征，可生成更符合真实面部运动和表情变化的视频。

其支持单独使用音频或面部标志点生成肖像视频，也支持将音频和人像照片相结合做出“对口型”一般的效果。据悉，其支持多语言（包含中文普通话、英语）及多风格，也可应对唱歌等场景。

代码网附相关链接：

项目地址：https://badtobest.github.io/echomimic.html
github：https://github.com/badtobest/echomimic

iQOO 首款 AI 方形智能方表 WATCH GT 预热：支持 AI 速记、百变表盘、智慧视窗等

iQOO WATCH GT 将于 7 月 11 日 19:00 在北京环球度假区发布，该产品为 iQOO 首款 AI 智能方表。 [阅读全文]
Anthropic 首席执行官：未来三年内，AI 大模型训练成本将上升至百亿甚至千亿美元

Dario Amodei作出预测，未来三年内，AI大模型的训练成本将上升至100亿美元甚至1000亿美元（当前约 7294.28 亿元人民币）。 [阅读全文]
ChatGPT 无法取代人类程序员： IEEE 35 页论文测出困难编码正确率仅为 0.66%

上个月，一项发表在 IEEE TSE 期刊（Transactions on Software Engineering）上的研究评估了 ChatGPT 所生成的代码在功能性、复杂性和…

2024年07月09日 • 人工智能
可更换表圈，Nothing CMF Watch Pro 2 智能手表发布：售 69 美元

Nothing 公司今日推出了多款 CMF 新品，其中一款是 Watch Pro 2 智能手表。Watch Pro 2 的一大亮点是可更换表圈。用户可以选择多种... [阅读全文]
人工智能测谎技术问世：比人类更强，但需谨慎使用

德国维尔茨堡大学经济学家 Alicia von Schenk 及其团队最近研发了一款人工智能测谎工具，该工具的准确率明显高于人类水平。他们进行了相关实验以探究人... [阅读全文]
中国开源操作系统 openKylin（开放麒麟）发布 AIPC 版本

7 月 7 日，聚焦智能时代基础软件发展的 2024 CCF（中国计算机学会）系统软件技术论坛在长沙举行，会上中国开源操作系统 openKylin（开放麒麟）推... [阅读全文]

发表评论


验证码：

AI 根据声音内容帮照片“对口型”，蚂蚁集团开源 EchoMimic 项目

2024年07月13日 • 智能机器人 •我要评论

相关文章:

ChatGPT 无法取代人类程序员： IEEE 35 页论文测出困难编码正确率仅为 0.66%

发表评论