语音 - 第2页|程序员档案馆

Unity AR RT-Voice文字转语音进一步研究和bug调试_unity rtvoice

目录一、Unity AR识别物体播放音频 1.物体识别播放音频 2.点击UI的按钮播放音频二、使用RT-Voice文字转语音的一些问题及解决办法 1.在电脑中运行，一切正...

Bloger 09-03 0 422 技术文档

一、前言 sherpa-onnx 具有诸多优势，它功能丰富，支持语音转文本、文本转语音、说话人识别等多种功能且能离线运行，无需联网；可在多种架构和操作系统上使...

Bloger 09-03 0 253 技术文档

大家好，我是[晚风依旧似温柔]，新人一枚，欢迎大家关注~ 本文目录：概述：语音识别的基本概念集成语音识别 SDK 语音转文本与控制指令解析代码示...

Bloger 09-03 0 470 技术文档

简介： TTS Azure Web 是一个 Azure 文本转语音（TTS）网页应用。通过语音合成标记语言 (SSML) 对输出语音结果微调，可以在本地运行或使用你的 Azure Key 一...

Bloger 09-03 0 602 技术文档

Bili2text：一键将 Bilibili 视频转为文字的开源神器来源：Poixe AI Bili2text 是一款专为 Bilibili 用户打造的视频转文字工具。只需输入视频 AV 号，即可...

Bloger 09-03 0 196 技术文档

引言作为一个喜欢折腾开源项目的技术爱好者，最近我试用了 Project AIRI——一个能自己部署的虚拟伴侣系统。它不只是聊天机器人，还能陪你打游戏、实时语...

Bloger 09-03 0 896 技术文档

手机通话语音离线ASR识别商用和优化方向 --本地AI电话机器人上一篇：手机FunASR识别SIM卡通话占用内存和运行性能分析下一篇：编写中。一、前言前面的...

Bloger 09-03 0 931 技术文档

FreeSwitch通过WebSocket对接AI实时语音大模型插件技术方案 1. 方案概述基于FreeSWITCH的实时通信能力，通过WebSocket协议桥接AI大模型服务，实现低延迟、...

Bloger 09-03 0 289 技术文档

（2025年8月）2025大模型性能评测：语音识别与实时交互能力对比——响应速度实测 | 豆包大模型 | 语音识别 | 实时语音交互 | 性能评测在语音识别与实时交互能...

Bloger 09-03 0 112 技术文档

GitHub - k2-fsa/sherpa-onnx: Speech-to-text, text-to-speech, speaker diarization, speech enhancement, source separation, and VAD using next-gen Ka...

Bloger 09-02 0 840 技术文档