> 技术文档 > 【尝试】基于openai-whisper进行语音转文字windows版本

【尝试】基于openai-whisper进行语音转文字windows版本

1、下载ffmpeg

https://ffmpeg.org/download.html#build-windows

解压缩,并放置到指定位置

环境变量中进行配置

运行试看是否成功

 

2、确认电脑CUDA版本

下载Nvidia app

https://www.nvidia.cn/software/nvidia-app/

安装完成后,在终端输入:

nvidia-smi

3、创建虚拟环境

(1)创建whisper虚拟环境

conda create -n whisper python=3.10 -y

 

 (2)激活whisper环境

(3)安装pytorch等依赖

上pytorch官网:https://pytorch.org/get-started/locally/

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

 (4)安装whisper

pip install -U openai-whisper -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

安装完成后,创建一个whisper.py文件

import whispermodel = whisper.load_model(\"base\").to(\"cuda\") # 明确用 GPUresult = model.transcribe(\"your-audio-file.mp3\")print(result[\"text\"])

运行,whisper.py文件

通过管理器,看GPU的运行情况