> 文档中心 > 【语音之家】AI产业沙龙—如何应用k2开发语音识别系统

【语音之家】AI产业沙龙—如何应用k2开发语音识别系统

CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组小米集团语音之家北京希尔贝壳科技有限公司共同主办的【语音之家】AI产业沙龙—如何应用k2开发语音识别系统,将于2022年9月22日19:00-20:35线上直播。

参会嘉宾

姚增伟

嘉宾简介:姚增伟,小米公司新一代 Kaldi项目(Daniel Povey团队)核心开发成员,硕士毕业于哈尔滨工业大学,主要研究方向为语音识别。 

分享主题:新一代 Kaldi 中的 Reworked Conformer 模型以及基于多码本向量量化的蒸馏方案

摘要:本报告将介绍近期新一代 Kaldi 项目的两个核心贡献点。针对 Conformer 模型存在的问题进行改进,实现了训练稳定、性能更优的 Reworked Conformer 模型,其核心思想已拓展应用于 Emformer 和 LSTM 等模型中。基于多码本向量量化的蒸馏方案,通过将 teacher 模型的高维(如 1280 维)的 float 向量量化为极少数个(如 8 个)uint8 类型的码本索引,显著地降低了存储空间,并基于量化结果进行高效蒸馏。

匡方军

嘉宾简介:匡方军,小米公司新一代 Kaldi项目(Daniel Povey团队)核心开发成员,主要研究方向为语音识别。 

GitHub:https://github.com/csukuangfj

分享主题:新一代 Kaldi 部署框架 sherpa 分享

摘要:本报告将介绍如何使用新一代Kaldi 部署框架sherpa 在不同平台 (Linux/macOS/Windows/Raspberry Pi 等) 进行语音识别。

 沙龙议程

参加方式 

点击下方传送门进入CSDN直播间:

【语音之家】AI产业沙龙—如何应用k2开发语音识别系统-CSDN直播

 

全民K歌