Question 1

什么是 Azure Text to Speech，它是如何工作的？

Accepted Answer

Azure Text to Speech 是基于云的文字转语音服务，可利用神经网络模型将文本转换为语音。开发者通过 API 或 SDK 发送文本，选择语言和声音类型后，即可获得音频流或音频文件，用于播放、存储或在应用中进一步处理。

Question 2

Azure Text to Speech 是否提供免费额度或试用？

Accepted Answer

是的。Azure 为 Text to Speech 提供一定的免费额度和试用配额，方便您在正式上线前进行体验、测试质量和延迟表现。超过免费用量后，将根据处理的字符数或生成音频的用量按量计费。

Question 3

我可以创建自己的专属语音吗？

Accepted Answer

可以。通过 Custom Neural Voice 功能，您可以根据符合要求的高质量录音素材训练专属语音。微软会进行合规与安全审核，通过后即可在应用中安全调用这一品牌声音，但需遵守相关的负责任 AI 使用规范。

Question 4

Azure Text to Speech 支持哪些平台和语言？

Accepted Answer

该服务支持多种语言、地区和发音风格，可通过 REST API 以及多种主流编程语言的 SDK 集成到 Web、移动端（iOS/Android）、桌面和服务器等不同环境中。

Question 5

Azure 如何保护我的数据和语音模型安全？

Accepted Answer

Azure Text to Speech 部署在 Azure 安全基础设施之上，支持传输与存储加密、访问控制，并符合多项行业合规标准。自定义语音的录音数据和模型会隔离保存在您的 Azure 资源中，且受严格的隐私和负责任 AI 政策约束。

Azure Text to speech

工具概览

概览

功能特点

相关标签

应用场景

常见问题

什么是 Azure Text to Speech，它是如何工作的？