基于python简单实现文字转语音和语音识别_Python

直接语音合成

需要安装

pip3 install pyttsx3
pip3 install pypiwin32

安装pyttsx3的时候出错，结果重装了一次python才行。。。

tips:最后本人安装的版本是3.6

import pyttsx3
# 初始化
engine = pyttsx3.init()

engine.say('我要开始语音合成')
engine.say('好好学习，天天向上')
engine.say('hello world')

engine.runandwait()

文本文件语音合成wav

依赖安装

pip3 install comtypes

代码

from comtypes.client import createobject
from comtypes.gen import speechlib
engine = createobject("sapi.spvoice")
stream = createobject('sapi.spfilestream')
infile = 'demo.txt'
outfile = 'demo_audio.wav'
stream.open(outfile,speechlib.ssfmcreateforwrite)
engine.audiooutputstream = stream
f = open(infile,'r',encoding='utf-8') #中文得用utf-8格式
thetext = f.read()
f.close()
engine.speak(thetext)
stream.close()
print("合成成功")

语音转文本

pip3 install pocketsphinx
pip3 install speechrecognition

安装pocketsphinx可能出现错误

后来查了半天，，也下载了swig但是不会弄。看到pocketsphinx的文档

我猜可能是python3.8装不了？然后我装了python3.6版本，一下就安装好了。。。

import speech_recognition as sr
audio_file = 'demo_audio.wav'
r = sr.recognizer()

with sr.audiofile(audio_file) as source:
    audio = r.record(source)

print('文本内容:',r.recognize_sphinx(audio))

因为pocketsphinx只装有英文语音包，只能识别英文，识别率还算可以

安装中文语言包

下载之后解压到安装python的路径里，如下

e:\python3.6\lib\site-packages\speech_recognition\pocketsphinx-data

更改文件夹名 zh-cn

并把文件里面的名字改成和en-us的相同

然后在代码中修改

print('文本内容:',r.recognize_sphinx(audio,language='zh-cn'))

转换过程没英文那么快（毕竟中文博大精深），自己录音的识别率不高，我是用前面的文本转语音wav文件识别的。

到此这篇关于基于python简单实现文字转语音和语音识别的文章就介绍到这了,更多相关python文字转语音内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网！

Python lambda函数(匿名函数)、参数类型与递归全解析

在 python 中，函数是代码组织的核心单元。除了基础定义与调用，lambda 匿名函数、灵活的参数类型以及递归函数等进阶特性，能极大提升代码的简洁性与灵活性... [阅读全文]

Python中argparse模块命令行参数详细解析

一、argparse的主要功能argparse 是 python 标准库中用于解析命令行参数的模块，主要包括：自动生成帮助和使用信息支持位置参数和可选参数多种参... [阅读全文]

基于Python制作一个词频统计工具的完整指南

引言词频统计是自然语言处理(nlp)和文本分析的基础工具之一，它通过统计一段文本中每个单词出现的频率，可以帮助用户快速了解文本的关键内容和主题分布。这种技术广泛... [阅读全文]

Python 错误处理的最佳实践

1. 什么是异常？异常（exception）就是程序运行时发生的错误，比如试图打开一个不存在的文件、除以零或者输入了非法数据。python 会抛出异常来告诉你&... [阅读全文]

Python自定义异常的全面指南(入门到实践)

引言：为什么需要自定义异常想象你正在开发一个银行系统，用户转账时余额不足。如果直接抛出valueerror，调用方很难区分是金额格式错误还是余额不足。又或者你正... [阅读全文]

Linux升级或者切换python版本实现方式

升级系统python版本 (适用于全局修改)如果你希望将系统默认的 python 版本升级到 3.11 或更高，以便所有项目都能使用新版本，可以采取此方案。具体... [阅读全文]


验证码：

验证码：

基于python简单实现文字转语音和语音识别

2025年08月07日 • Python •我要评论

直接语音合成

文本文件语音合成wav

语音转文本

相关文章:

发表评论