当前位置: 代码网 > it编程>前端脚本>Python > Edge-TTS:微软推出的,免费、开源、支持多种中文语音语色的AI工具

Edge-TTS:微软推出的,免费、开源、支持多种中文语音语色的AI工具

2024年08月05日 Python 我要评论
Edge-TTS是由微软推出的文本转语音Python库,通过微软Azure Cognitive Services转化文本为自然语音。适合需要语音功能的开发者,GitHub上超3000星。作为国内付费TTS服务的替代品,Edge-TTS支持40多种语言和300种声音,提供优质的语音输出,满足不同开发需求。

edge-tts是由微软推出的文本转语音python库,通过微软azure cognitive services转化文本为自然语音。适合需要语音功能的开发者,github上超3000星。作为国内付费tts服务的替代品,edge-tts支持40多种语言和300种声音,提供优质的语音输出,满足不同开发需求。

 

1.安装部署

首先,你需要通过python包管理工具pip来安装edge-tts库。只需在命令行中输入以下命令(没有python环境的自行配置一下):

pip install edge-tts

如果只想使用edge-tts和edge-playback命令,最好使用 pipx:

pipx install edge-tts

安装完成后,你就可以开始使用edge-tts来将文本转换为语音了。edge-tts支持多种语言和不同的声音选项,你可以根据需要选择合适的声音。

2.文本转语音

我们先来个hello world,只需要一行代码!

edge-tts --text "hello world" --write-media hello.mp3

执行完毕之后,会在你执行的目录下,生成hello.mp3文件

如果你想立即播放带有字幕的内容,可以使用以下edge-playback命令:

edge-playback --text "hello, world!"

注意以上需要安装mpv命令行播放器。所有命令也都edge-tts可以工作。edge-playback

3.支持的语言和音色

edge-tts支持英语、汉语、日语、韩语、法语等40多种语言,共300多种可选声音,执行以下命令查询:

edge-tts --list-voices

如下图所示:

 

查询结果中的gender为声音的性别,name为声音的名字,如zh-cn-yunjianneural,其中zh表示语言,cn表示国家或地区,可以根据需求选择不同的声音。

使用--voice参数来指定声音名称,下面我使用zh-cn-yunyangneural声音来合成一个中文音频。

edge-tts --voice zh-cn-yunyangneural --text "大家好,欢迎关注语音之家,语音之家是一个助理ai语音开发者的社区。" --write-media hello_in_cn.mp3

4.调整语速、音量和音调

可以对生成的语音进行细微修改。

$ edge-tts --rate=-50% --text "hello, world!" --write-media hello_with_rate_halved.mp3 --write-subtitles hello_with_rate_halved.vtt
$ edge-tts --volume=-50% --text "hello, world!" --write-media hello_with_volume_halved.mp3 --write-subtitles hello_with_volume_halved.vtt
$ edge-tts --pitch=-50hz --text "hello, world!" --write-media hello_with_pitch_halved.mp3 --write-subtitles hello_with_pitch_halved.vtt

此外,必须使用 --rate=-50% 而不是 --rate -50%(注意等号的缺失),否则 -50% 将被解释为另一个参数。

5.使用代码转换

上面都是用命令转换,我们也可以写代码调用,开发http接口来提供语音合成服务。

以下是一个代码示例,将代码保存到一个文件中,如tts.py。

#!/usr/bin/env python3

"""
basic example of edge_tts usage.
"""

import asyncio

import edge_tts

text = "大家好,欢迎关注语音之家,语音之家是一个助理ai语音开发者的社区。"
voice = "zh-cn-yunyangneural"
output_file = "d:/test.mp3"


async def amain() -> none:
    """main function"""
    communicate = edge_tts.communicate(text, voice)
    await communicate.save(output_file)


if __name__ == "__main__":
    loop = asyncio.get_event_loop_policy().get_event_loop()
    try:
        loop.run_until_complete(amain())
    finally:
        loop.close()

运行python tts.py,稍等即可在d盘生成合成后的音频test.mp3。

关于 edge-playback 命令的说明

edge-playback 实际上是 edge-tts 的一个封装,用于播放生成的语音。它接受与 edge-tts 选项相同的参数。

 

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com