语音 - 第7页|程序员档案馆

B站开源TTS模型index-tts,超越 CosyVoice2、Fish-Speech 和 F5-TTS 等模型_indextts

引言 IndexTTS 是 B 站（哔哩哔哩）推出的一款文本转语音（TTS）系统，基于开源项目 XTTS 和 Tortoise 开发，并针对中文语音合成的特定需求进行了优化。用...

Bloger 08-15 0 674 技术文档

调整VAD参数 1. 查找VAD模型的配置文件 FunASR中的VAD模型为FSMN-VAD，参数配置类为VADXOptions，可以在以下路径中找到： /workspace/FunASR/runtime/python...

Bloger 08-15 0 999 技术文档

伊米奇变声器官网https://imic.yunk.ltd/zh-cn/ 你是否曾经想过，在网络世界中用另一种声音表达自己？无论是游戏中的角色扮演，还是语音通话中的趣味互动，...

Bloger 08-15 0 906 技术文档

一、引言本项目基于乐鑫 ESP32-S3 微控制器，结合 ASRPRO 离线语音识别模块，实现了语音控制幻彩 LED 灯光、LCD 显示屏信息交互，以及基于 DeepSee...

Bloger 08-15 0 363 技术文档

将文本生成音频通常需要结合文本转语音（TTS，Text-to-Speech）工具或库来实现，比如 Google TTS (gtts)、Amazon Polly、Microsoft Azure TTS 等。一、使...

Bloger 08-15 0 4 技术文档

AI技术通过多模态应用（即融合文本、图像、语音、视频、传感器数据等多维度信息）正在深刻重塑工作模式、行业生态和人类创造力边界。以下从技术融合、行业变...

Bloger 08-08 0 987 技术文档

开发者朋友们大家好：这里是「RTE 开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「...

Bloger 08-08 0 28 技术文档

本文围绕用 Python 实现语音转文字以轻松搞定会议记录展开，首先介绍了实现该功能的核心 Python 库，如 SpeechRecognition、pydub 等，随后详细阐述了从语音...

Bloger 08-08 0 944 技术文档

网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知...

Bloger 08-08 0 382 技术文档

开发者朋友们大家好：这里是「RTE 开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「...

Bloger 08-08 0 90 技术文档