当前位置：代码网 > 科技>人工智能>机器学习 > openai 开源模型Whisper语音转文本模型下载使用

openai 开源模型Whisper语音转文本模型下载使用

2024年08月01日 • 机器学习 •我要评论

Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。官方地址。

whisper

whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。官方地址 https://github.com/openai/whisper

方法

approach

一个transformer序列到序列模型被训练在多种语音处理任务上，包括多语言语音识别、语音翻译、口语语言识别以及语音活动检测。这些任务被共同表示为一系列由解码器预测的令牌，使得单一模型能够替代传统语音处理管道中的多个阶段。多任务训练格式采用了一组特殊令牌，作为任务指定符或分类目标。

设置

whisper使用python 3.9.9和pytorch 1.10.1来训练和测试我们的模型，但代码库预期与python 3.8至3.11版本及近期的pytorch版本兼容。该代码库还依赖于几个python包，特别是openai的tiktoken，用于其快速的分词器实现。你可以使用以下命令下载并安装（或更新至）whisper的最新版本：

pip install -u openai-whisper

或者，以下命令将从这个仓库拉取并安装最新的提交，以及它的python依赖项：

赞 (0)

相关文章:

大数据漫谈（一）——Hadoop概述

Hadoop是一个分布式系统基础架构，主要业务为和分别由和两个核心设计负责，另外一个核心组件为是 Hadoop 的文件系统，它将大，并在。它提供了高容错性，即使... [阅读全文]
Spark-机器学习（1）什么是机器学习与MLlib算法库的认识

从这一系列开始，我会带着大家一起了解我们的机器学习，了解我们spark机器学习中的MLIib算法库，知道它大概的模型，熟悉并认识它。同时，本篇文章为个人spark免费专栏的系列文章…

2024年08月01日 • 人工智能
深度解析 Spark（进阶）：架构、集群运行机理与核心组件详解

Spark 应用程序作为集群上独立的进程集运行，由SparkContext 主程序（称为驱动程序）中的对象进行协调。具体来说，为了在集群上运行，SparkContext 可以连接到…

2024年08月01日 • 人工智能
ubuntu20.04安装星火商城（spark store）

cd /tmp。 [阅读全文]
Spark3的新特性

Spark3新特性…

2024年08月01日 • 人工智能
Pyspark+关联规则 Kaggle购物篮分析案例

零售商期望能够利用过去的零售数据在自己的行业中进行探索，并为客户提供有关商品集的建议，这样就能提高客户参与度、改善客户体验并识别客户行为。本文将通过pyspark对数据进行导入与预…

2024年08月01日 • 人工智能

版权声明：本文内容由互联网用户贡献，该文观点仅代表作者本人。本站仅提供信息存储服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 2386932994@qq.com 举报，一经查实将立刻删除。

发表评论


验证码：

Copyright © 2017-2026 代码网保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱：2386932994@qq.com