> 技术文档 > Whisper-Medusa 项目使用教程

Whisper-Medusa 项目使用教程


Whisper-Medusa 项目使用教程

1. 项目目录结构及介绍

Whisper-Medusa 项目目录结构如下:

whisper-medusa/├── assets/  # 存放项目相关资源文件├── whisper_medusa/ # 主程序文件和模块│ ├── __init__.py│ ├── trainer.py # 模型训练相关代码│ └── WhisperMedusaModel.py # WhisperMedusa 模型实现├── .gitignore  # 指定git忽略的文件├── LICENCE  # 项目许可证文件├── README.md # 项目说明文件├── requirements.txt # 项目依赖的Python库└── setup.py # 项目安装和依赖配置
  • assets/:存放项目相关的资源文件,如数据集、预训练模型等。
  • whisper_medusa/:包含项目的主要代码,包括模型定义、训练和测试脚本。
  • .gitignore:列出git应该忽略的文件和目录,如本地设置文件、日志文件等。
  • LICENCE:项目的许可证信息,本项目采用MIT协议。
  • README.md:项目的说明文件,包含项目介绍、使用方法和依赖等。
  • requirements.txt:项目运行所需的Python库列表。
  • setup.py:项目的安装脚本,用于安装依赖和设置项目环境。

2. 项目的启动文件介绍

项目的启动主要是通过whisper_medusa/trainer.py脚本进行。以下是启动项目的基本步骤:

  1. 克隆项目到本地:

    git clone https://github.com/aiola-lab/whisper-medusa.git
  2. 创建并激活虚拟环境,安装依赖:

    conda create -n whisper-medusa python=3.11 -yconda activate whisper-medusapip install -r requirements.txt
  3. 运行训练脚本开始训练模型:

    python whisper_medusa/trainer.py

训练脚本trainer.py中包含了模型训练的所有相关参数和配置,用户可以根据自己的需求调整。

3. 项目的配置文件介绍

项目的主要配置参数都集中在whisper_medusa/trainer.py文件中。以下是部分重要的配置参数:

  • --whisper-model-name:指定基础 Whisper 模型的名称。
  • --output-path:指定模型训练过程中输出的文件路径。
  • --exp-name:指定实验名称,用于标识不同的训练过程。
  • --train-data-path--validation-data-path--test-data-path:指定训练、验证和测试数据的路径。
  • --parts-to-freeze:指定在训练过程中冻结的模型部分。
  • --max-steps--eval-steps--save-steps:指定训练的最大步骤数、评估间隔和保存模型的间隔。
  • --batch-size--gradient-accumulation-steps:指定训练的批次大小和梯度累积步骤。
  • --lr--lr-scheduler-type:指定学习率和学习率调度器的类型。

用户可以通过命令行参数的形式在启动训练时传入这些配置参数,以调整模型的训练过程。

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考