语音 - 第14页|程序员档案馆

AI大模型前沿：Muyan-TTS开源零样本语音合成技术解析

AI大模型前沿：Muyan-TTS开源零样本语音合成技术解析引言：语音合成技术的演进与Muyan-TTS的突破性意义语音合成（Text-to-Speech, TTS）技术作为人机交互...

Bloger 07-30 0 855 技术文档

前言如果您是原生微信小程序，请访问这篇文章。在 uni-app 微信小程序开发中，详细接入官方同声传译官方插件，实现文字转语音朗读做商业收款 “微信/支...

Bloger 07-30 0 316 技术文档

开车时无需动手，只需说句话就能切换音乐、调整导航；在智能家电前挥挥手，灯光、空调便自动响应指令。这些看似科幻的场景，正通过AI与HMI（人机交互）技术...

Bloger 07-30 0 951 技术文档

Whisper-large-v3 模型安装与使用教程引言在当今的语音识别和翻译领域，Whisper-large-v3 模型凭借其强大的性能和广泛的语言支持，成为了自动语音识别（AS...

Bloger 07-30 0 578 技术文档

本文还有配套的精品资源，点击获取简介：微软的文本到语音（TTS）技术是现代信息技术中的关键语音合成技术，可以将文本转换成接近自然人声的音频输出。...

Bloger 07-30 0 860 技术文档

whisperIME：打造语音输入新体验项目介绍 whisperIME 是一个基于 Whisper 语音识别引擎的输入法编辑器（IME）。它不仅作为一款独立的 App，可以翻译支持的...

Bloger 07-30 0 435 技术文档

Whisper 语音识别 API 的调用与封装：从新手到高手的实战指南关键词：Whisper API、语音识别、API调用、代码封装、语音转文字摘要：本文以OpenAI的Whis...

Bloger 07-30 0 680 技术文档

言简意赅的讲解VOSK解决的痛点 💡 推荐配套阅读 → XTTS实现语音克隆：精确控制音频格式与生成流程【TTS的实战指南】这篇文章详细讲解了音频在语音克...

Bloger 07-30 0 603 技术文档

AI文本转语音+语音转文本 1.引言 2.实例 2.1文本转语音 2.2文字合成语音 2.3语音转文字 2.4使用热词库 2.5完整代码 3.总结 1.引言在AI领域，文本转语...

Bloger 07-30 0 892 技术文档

在移动互联网与人工智能技术深度融合的今天，将AI能力嵌入微信小程序已成为提升用户体验的重要途径。本文将系统阐述如何通过微信AI开放平台的强大能力，在原...

Bloger 07-30 0 418 技术文档