【语音之家】AI产业沙龙—如何应用k2开发语音识别系统

文档中心

由CCF语音对话与听觉专委会 、中国人工智能产业发展联盟（AIIA）评估组、小米集团、语音之家、北京希尔贝壳科技有限公司共同主办的【语音之家】AI产业沙龙—如何应用k2开发语音识别系统，将于2022年9月22日19:00-20:35线上直播。

参会嘉宾

姚增伟

嘉宾简介：姚增伟，小米公司新一代 Kaldi项目（Daniel Povey团队）核心开发成员，硕士毕业于哈尔滨工业大学，主要研究方向为语音识别。

分享主题：新一代 Kaldi 中的 Reworked Conformer 模型以及基于多码本向量量化的蒸馏方案

摘要：本报告将介绍近期新一代 Kaldi 项目的两个核心贡献点。针对 Conformer 模型存在的问题进行改进，实现了训练稳定、性能更优的 Reworked Conformer 模型，其核心思想已拓展应用于 Emformer 和 LSTM 等模型中。基于多码本向量量化的蒸馏方案，通过将 teacher 模型的高维（如 1280 维）的 float 向量量化为极少数个（如 8 个）uint8 类型的码本索引，显著地降低了存储空间，并基于量化结果进行高效蒸馏。

匡方军

嘉宾简介：匡方军，小米公司新一代 Kaldi项目（Daniel Povey团队）核心开发成员，主要研究方向为语音识别。

GitHub：https://github.com/csukuangfj

分享主题：新一代 Kaldi 部署框架 sherpa 分享

摘要：本报告将介绍如何使用新一代Kaldi 部署框架sherpa 在不同平台 (Linux/macOS/Windows/Raspberry Pi 等) 进行语音识别。

沙龙议程

参加方式

点击下方传送门进入CSDN直播间：

【语音之家】AI产业沙龙—如何应用k2开发语音识别系统-CSDN直播

全民K歌

【语音之家】AI产业沙龙—如何应用k2开发语音识别系统

参会嘉宾

沙龙议程

参加方式

公告

标签

【语音之家】AI产业沙龙—如何应用k2开发语音识别系统

参会嘉宾

沙龙议程

参加方式

相关问题

公告

标签