导言:当遇到无字幕、难理解的音频或视频,想要获取字幕文本怎么办?想要解放双手,在电脑端直接录音转文字怎么办?今天小编来为大家介绍一款全程免费、支持多语种、准确率高,且可以直接生成多种格式文字稿的asr工具whisperdesktop。
whisper简介 whisper description
whisper是由openai开发的一个自动语音识别(asr)开源系统。经过训练,它能够支持多种语言的语音转录,并且可以将这些语言翻译成英文,同时还能够有效地过滤掉背景音和杂音。
whisper官方介绍:https://openai.com/research/whisper
whisper支持的语言种类丰富
openai的技术文档介绍了如何基于whisper模型调用语言转文本api来实现语言转写或将语言翻译成英文的功能。
speech-to-text api 介绍文档
可实现本地电脑的音频转文字软件!完全免费开源!支持 windows、macos、linux(目前界面只有英文的,但支持中文的转换)
特征
- 基于 directcompute 的供应商不可知的 gpgpu;该技术的另一个名称是“direct3d 11 中的计算着色器”
- 纯 c++ 实现,除了基本的 os 组件外没有运行时依赖性
- 比 openai 的实现快得多。
- 混合 f16 / f32 精度:自 d3d 版本 10.0 起,windows [color=var(--color-accent-fg)]需要缓冲区 的支持r16_float
- 内置性能分析器,可测量单个计算着色器的执行时间
- 内存使用率低
- 用于音频处理的媒体基础,支持大多数音频和视频格式(ogg vorbis 除外),以及大多数在 windows 上运行的音频捕获设备(除了一些专业的,它们只实现 asio api [color=var(--color-accent-fg)]。
- 用于音频捕获的语音活动检测。
whisperdesktop工具下载 whisperdesktop
基于whisper模型,konstanti设计了一款工具whisperdesktop,能够在windows系统中直接使用,无需api key,且安装步骤及操作都十分便捷。下面就来跟随小编一起下载体验吧~
whisperdesktop 下载操作
首先,打开https://github.com/const-me/whisper,找到页面右下方releases中的最新版本,点击进行下载。为了方便下载,我们提供了百度网盘的下载地址,详细如下。
完成下载后,将压缩包进行解压缩,找到whisperdestop.exe,即为工具程序,点击运行。运行成功后进入主页面,开始配置。
在使用前,需要下载一个二进制文件,请点击页面中的hugging face。
https://huggingface.co/ggerganov/whisper.cpp/tree/main
打开这个网页之后,我们会看到很多文件,根据whisper模型的不同型号(tiny, base, small, medium, large-v1, large-v2),网页上提供了多种二进制文件(.bin文件)。模型越大,转写及翻译的准确度就越高,但同时运行的速度也会相对变慢。大家可以根据电脑配置及使用需求来选择。
how to use 使用操作--文件转写
将文件下载成功后,将文件所在的本地路径复制到model path后,配置完毕,点击ok,进入使用界面。
1.在language中选择音频或者视频中的语种。如果希望将其他语言翻译成英文,请勾选translate。
2.点击transcribe file栏中右侧的小方框,选择转写文件。
3.在output format的下拉菜单中,你可以选择输出的格式:纯文本text、带时间轴的文本text with timestamps、srt格式的字幕文件 subrip subtitles以及webvtt格式的字幕文件 webvtt subtitles。
4.如果希望将转写文件与原文件放在同一目录下,请勾选 “place that file to the input folder”,或者你可以选择新建一个文件,将文件的路径复制到下方。
均设置好后,点击transcribe进行转写。
how to use 使用操作--语音转写
whisperdesktop还支持audio capture的功能,即将录音结果进行转写或翻译。点击下方audio capture按钮,进入音频转写页面。
将转写文件、语言、输出文件等设置选定后,点击capture,开始录音并转写。
如果想返回文件转写页面,点击下方transcribe file即可。
以上就是whisperdesktop本地音频转文字软件的使用方法,希望大家喜欢,请继续关注代码网。
发表评论