- 产品›
- Amazon Polly›
- Amazon Polly 功能
Amazon Polly 功能
简单易用的 API
Amazon Polly 提供了一个 API,使您能够快速将语音合成集成到应用程序中。您只要将想要转换为语音的文本发送到 Amazon Polly API,Amazon Polly 就会立即将音频流返回您的应用程序。应用程序可以直接播放该音频流,也可以将其存储为 MP3 等标准音频文件格式。
采样率
示例代码
from boto3 import client
polly = client("polly", region_name="us-east-1")
response = polly.synthesize_speech(
Text="Hi.My name is Joanna.",
OutputFormat="mp3",
VoiceId="Joanna")
广泛的语音和语言选择
|
语言
|
女
|
男
|
|---|---|---|
|
澳大利亚英语
|
||
|
巴西葡萄牙语
|
||
|
加拿大法语
|
|
|
|
丹麦语
|
||
|
荷兰语
|
||
|
法语
|
||
|
德国
|
||
|
印地语
|
|
|
|
冰岛语
|
||
|
印度英语
|
|
|
|
意大利语
|
||
|
日语
|
||
|
朝鲜语
|
|
|
|
普通话
|
|
|
|
挪威语
|
|
|
|
波兰语
|
||
|
葡萄牙伊比利亚语
|
||
|
罗马尼亚语
|
|
|
|
俄语
|
||
|
西班牙卡斯蒂利亚语
|
||
|
瑞典语
|
|
|
|
土耳其语
|
|
|
|
英国英语
|
||
|
美国英语
|
||
|
美国西班牙语
|
||
|
威尔士语
|
|
|
|
威尔士英语
|
|
使用合成语音功能,获得增强的视觉体验
Amazon Polly 让您可以轻松请求额外的元数据流,以了解特定语句、词语和声音的发出时间。通过将此元数据流与合成语音音频流结合使用,您现在可以构建具有增强视觉体验的应用程序,例如语音同步面部动画或者卡拉 OK 风格的字词突出显示。
要详细了解如何使用语音标记,请访问文档。
调节语速、音调和音量
Amazon Polly 支持语音合成标记语言(SSML),它是一种适用于语音合成应用程序的基于 XML 的 W3C 标准标记语言;Amazon Polly 还支持常用的 SSML 标签,用于调整措辞、强调和语调。这种灵活性可以帮助您制作生动逼真的语音,以更好地吸引受众的注意力。
要了解更多信息,请访问关于 SSML 标签的 Amazon Polly 文档。
了解详情
|
样本
|
|
SSML
|
|---|---|---|
|
这是我平常说话的方式。
|
(无) |
|
|
我可以用较高的音调说话,或者我可以用较低的音调说话。
|
<speak>我可以用<prosody pitch="high">较高的音调说话</prosody>,或者我可以<prosody pitch="low">用较低的音调</prosody></speak>说话 |
|
|
我能说得非常慢,也能说得非常快。
|
<speak>我能说得<prosody rate="x-slow">非常慢</prosody>,也能说得<prosody rate="x-fast">非常快</prosody></speak> |
|
|
我还可以非常大声地说话,或者我可以非常小声地说话。
|
<speak>我还可以<prosody volume="x-loud">非常大声地说话</prosody>,或者我也可以<prosody volume="x-soft">非常小声地说话</prosody>。</speak> |
|
|
我可以悄声说话。
|
<speak>我有一个秘密要告诉你,我来悄悄地告诉你。<amazon:effect name="whispered">'<prosody rate="x-slow"> <prosody volume="loud">我不是人类。</prosody></prosody></amazon:effect>你相信吗?</speak> |
调节语音的最长持续时间
Amazon Polly 通过一项名为“时间驱动韵律”,使您能够根据您定义的最大分配时间来自动调整语速。这在许多使用场景中都十分实用,尤其是在本地化方面。
例如,假设您的培训视频中嵌入的是美国英语语音,您想将此视频本地化为德语。假设您翻译了视频文本,并使用 Amazon Polly 制作了德语语音。将本地化后的德语语音流准确放入视频相应的帧中非常关键,德语语音的持续时间不能比美国英语语音的持续时间长。您可以使用此功能使配音过程更加便利。
平台和变成语言支持
Amazon Polly 支持亚马逊软件开发工具包中包含的所有编程语言(Java、Node.js、.NET、PHP、Python、Ruby、Go 和 C++)和亚马逊移动软件开发工具包中包含的所有编程语言(iOS/Android)。Polly 还支持 HTTP API,因此您可以实施自己的访问层。
通过 API、控制台或命令行使用语音合成功能
您可以通过 Polly API(各种特定语言的软件开发工具包)、亚马逊云科技管理控制台和亚马逊命令行界面(CLI)访问 Amazon Polly。您可以完全控制 Amazon Polly 的所有功能,无论您是通过控制台、API 还是 CLI 使用此服务。
自定义字典
借助 Amazon Polly 的自定义字典或词汇表,您可以使用修改公司名称、首字母缩略词、外来词和新词等特定词语的发音,例如“ROTFL”和用非法语语音说出的“C’est la vie”。要自定义这些发音,您需要上传一份包含词汇条目的 XML 文件。比如,您可通过使用以下 XML ,提供音素以自定义 Nguyen 的发音:
<lexeme>
<grapheme>Nguyen</grapheme>
<grapheme>nguyen</grapheme>
<grapheme>NGUYEN</grapheme>
<phoneme>"nu.jEn'</phoneme>
</lexeme>