当前位置: 代码网 > it编程>前端脚本>Python > sherpa-onnx说话人识别+语音识别自动开启(VAD)+语音识别Python API

sherpa-onnx说话人识别+语音识别自动开启(VAD)+语音识别Python API

2024年07月31日 Python 我要评论
实现实时语音识别,自动识别语音开始结束,识别讲话人身份

专栏总目录

        获取该开源项目的渠道,是我在b站上,看到了由csukuangfj制作的一套语音识别视频。以下地址均为csukuangfj在视频中提供,感谢分享!

新一代 kaldi: 说话人识别+vad+语音识别之 python api_哔哩哔哩_bilibili

        我之前已经使用了sherpa-ncnn和安装了kaldi,所以有些需要安装依赖的情况,跟大家会有不同。相关依赖安装情况,可以参考使用sherpa-ncnn进行中文语音识别(ubuntu22)-csdn博客详细解析ubuntu22 部署kaldi大模型_kaldi布署-csdn博客两篇文章。

一、安装sherpa-onnx模型

        文档中介绍了多种语言及环境的使用方法,这里只针对python开发包的安装使用进行测试。

(一)下载模型脚本文件

从开源项目地址下载文件:github - k2-fsa/sherpa-onnx: speech-to-text, text-to-speech, and speaker recognition using next-gen kaldi with o

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com