当前位置：代码网 > it编程>前端脚本>Python > sherpa-onnx说话人识别+语音识别自动开启（VAD）+语音识别Python API

sherpa-onnx说话人识别+语音识别自动开启（VAD）+语音识别Python API

2024年07月31日 • Python •我要评论

实现实时语音识别，自动识别语音开始结束，识别讲话人身份

专栏总目录

获取该开源项目的渠道，是我在b站上，看到了由csukuangfj制作的一套语音识别视频。以下地址均为csukuangfj在视频中提供，感谢分享！

新一代 kaldi: 说话人识别+vad+语音识别之 python api_哔哩哔哩_bilibili

我之前已经使用了sherpa-ncnn和安装了kaldi，所以有些需要安装依赖的情况，跟大家会有不同。相关依赖安装情况，可以参考使用sherpa-ncnn进行中文语音识别（ubuntu22）-csdn博客和详细解析ubuntu22 部署kaldi大模型_kaldi布署-csdn博客两篇文章。

一、安装sherpa-onnx模型

文档中介绍了多种语言及环境的使用方法，这里只针对python开发包的安装使用进行测试。

（一）下载模型脚本文件

从开源项目地址下载文件：github - k2-fsa/sherpa-onnx: speech-to-text, text-to-speech, and speaker recognition using next-gen kaldi with o

视频转换器mp4，好用只有这四款！

视频转换器可以让您轻松将各种视频转换为MP4格式，以便在各种设备和平台上播放和分享。我们将介绍几款优秀的视频转换器mp4，它们都能够高效地将视频转换为MP4格式，让您能够轻松地处理…

2024年07月31日 • 前端脚本
OpenCV-Python实战（2）——图像与视频文件的处理_pythonopencv处理视频(3)

在结束之际，我想重申的是，学习并非如攀登险峻高峰，而是如滴水穿石般的持久累积。尤其当我们步入工作岗位之后，持之以恒的学习变得愈发不易，如同在茫茫大海中独自划舟，稍有松懈便可能被巨浪…

2024年07月31日 • 前端脚本
超详细||YOLOv8基础教程（环境搭建，训练，测试，部署看一篇就够）（在推理视频中添加FPS信息）

2. 安装ultralytics（YOLOv8改名为ultralytics）这里有两种方式安装ultralytics3. 安装wandb登录自己的wandb账号... [阅读全文]
【保姆级教程】基于OpenCV+Python的人脸识别上课签到系统

本教程是基于opencv的人脸识别项目，比较适合新手入门实操。…

2024年07月31日 • 前端脚本
【opencv报错（已解决）】cv2.error: OpenCV(4.10.0) /Users/runner/work/opencv-python/opencv-python/opencv/modul

在大量查找资料和案例后，下载原本的opencv并重新安装了opencv-contrib-python、opencv-python等opencv库都无法解决上述错... [阅读全文]
Python图像处理——计算机视觉中常用的图像预处理

在计算机视觉项目中，使用样本时经常会遇到图像样本不统一的问题，比如图像质量，并非所有的图像都具有相同的质量水平。在开始训练模型或运行算法之前，通常需要对图像进行... [阅读全文]

发表评论


验证码：

sherpa-onnx说话人识别+语音识别自动开启（VAD）+语音识别Python API

2024年07月31日 • Python •我要评论

专栏总目录

一、安装sherpa-onnx模型

（一）下载模型脚本文件

相关文章:

视频转换器mp4，好用只有这四款！

OpenCV-Python实战（2）——图像与视频文件的处理_pythonopencv处理视频(3)

【保姆级教程】基于OpenCV+Python的人脸识别上课签到系统

发表评论