语音转文本-Amazon

语音转文本-Amazon

专用API
【更新时间: 2024.06.18】 Amazon Transcribe 语音转文本API 使用一种称为自动语音识别 (ASR) 的深度学习过程,快速准确地将语音转换为文本。
服务星级:2星
⭐ ⭐ 🌟 🌟 🌟 🌟 🌟
调用次数
0
集成人数
0
商用人数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是Amazon 的语音转文本?

"Amazon 语音转文本-Transcribe"是Amazon提供的一项基于云端的自动语音识别(ASR)服务,它可以将音频和视频文件中的语音内容转换为高质量的文本转录。Transcribe支持多种语言,包括英语、西班牙语、中文、法语、德语等,旨在帮助用户轻松地将音频内容转换为易于阅读、编辑和搜索的文本格式。

什么是Amazon 的语音转文本?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用Amazon 的语音转文本,从而实现程序的自动化交互,提高服务效率。

Amazon 的语音转文本有哪些核心功能?

1. 从客户通话、视频文件、临床对话等资源中提取关键业务见解。

2. 借助完全托管和持续训练的最先进语音识别模型改善业务成果。

3. 使用理解所在领域特定词汇的自定义模型提高准确性。

4. 通过掩盖敏感信息确保客户隐私和安全性。

Amazon 的语音转文本的核心优势是什么?

  1. 高精度:使用先进的机器学习技术,能够生成高质量、高准确率的转录文本。

  2. 灵活性:支持多种音频格式和多种语言,适应不同场景和需求。

  3. 可扩展性:基于云端的架构,能够轻松处理大规模音频数据,满足企业级需求。

  4. 可定制性:允许用户根据需求自定义词汇表和语言模型,提高转录的准确性和特定领域的适用性。

  5. 安全性:提供多种安全功能,如数据加密、访问控制等,确保用户数据的安全和隐私。

在哪些场景会用到Amazon 的语音转文本?

  1. 媒体和娱乐:用于电影、电视节目、播客等媒体内容的字幕制作和搜索。

  2. 教育:用于在线课程和讲座的转录,方便学生复习和搜索。

  3. 法律:用于法庭审判、律师咨询等场景的音频记录转录,便于查阅和引用。

  4. 企业会议:用于公司内部会议和研讨会的音频记录转录,方便整理和分享会议内容。

<
产品价格
>
按实际使用量付费模式

您按月付费,计费依据是您处理的文本的字符数量。Amazon Polly 的标准语音定价为:对于超出免费套餐的语音或语音标记请求,每 100 万个字符 4.00 USD。Amazon Polly 的神经语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 16.00 USD。Amazon Polly 的长格式语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 100.00 USD。 Amazon Polly 的生成式语音定价为:对于超出免费套餐的语音请求,每 100 万个字符 30 USD。

每月数百万个字符

对于 Amazon Polly 的标准语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 500 万个字符服务。对于神经语音,从您提交第一个语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 100 万个字符服务。对于长格式语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 50 万个字符服务。 对于生成式语音,从您提交第一个 Polly 语音请求起 12 个月内,针对该类请求,免费套餐每个月提供 10 万字符的服务。

<
使用指南
>
Step 1 - Sign up for an Amazon Web Services account
设置并登录您的 AWS 账户 观看网络研讨会并阅读文档 登录 Polly 控制台并开始构建。
<
产品问答
>
?
什么是 Amazon Transcribe?
Amazon Transcribe 是一项 AWS 人工智能(AI)服务,使您能够轻松实现语音转文本功能。采用自动语音识别(ASR)技术,您可以将 Amazon Transcribe 用于各种业务应用程序,包括转录基于语音的客户服务通话、生成音频/视频内容字幕,以及对音频/视频内容执行(基于文本的)内容分析。
?
Amazon Transcribe 如何与其他 AWS 产品交互?
Amazon Transcribe 可以将音频输入转换为文本,这为开发基于语音输入的各种文本分析应用程序打开了方便之门。例如,通过将 Amazon Comprehend 用于来自 Amazon Transcribe 的转换后文本数据,您可以进行情绪分析或提取实体和关键短语。同样,通过将 Amazon Translate 与 Amazon Poly 集成,您可以接收一种语言的语音输入,然后将其翻译为另一种语言并生成语音输出,从而有效地实现多种语言对话。还可以将 AmazonTranscribe与 Amazon Kendra 或AmazonOpenSearch 集成,以便在音频/视频库内编写索引并执行基于文本的搜索。要了解更多信息,请查看实时呼叫分析和座席协助、呼叫后分析、媒体搜索或内容分析解决方案。
?
我在使用 Amazon Transcribe 之前还应了解什么?
Amazon Transcribe 旨在处理各种语音和声学特征,包括音量、音调和语速的变化。音频信号的质量和内容(包括但不限于背景噪音、扬声器重叠、口音或一个音频文件内语言间的切换等因素)可能会影响服务输出的准确性。我们在不断更新服务,以改进其适应其他声音变化和内容类型的能力, 使用 Amazon Transcribe
<
关于我们
>
亚马逊云科技(Amazon Web Services,简称AWS)是全球领先的云计算服务提供商,提供包括计算、存储、数据库、分析、机器学习、物联网、移动、安全、混合云、虚拟和增强现实等在内的广泛服务。AWS在全球34个地理区域内运营108个可用区,服务超过200个国家和地区,帮助企业、开发者和政府机构构建灵活、可靠、可扩展的云基础设施。作为亚马逊公司的一部分,AWS致力于提供创新的云解决方案,支持客户实现数字化转型。
联系信息
服务时间: 早9:00-晚8:00 (法定假期除外)
电话号码: +86 (10) 1010 0866
网页在线客服: 咨询

AWS 云计算

Amazon Web Services(AWS)是全球最全面、应用最广泛的云,从全球数据中心提供超过 200 项功能齐全的服务。数百万客户(包括增长最快速的初创公司、最大型企业和主要的政府机构)都在使用 AWS 来降低成本、提高敏捷性并加速创新。

 

 

<
最可能同场景使用的其他API
>
API接口列表
<
产品价格
>
按实际使用量付费模式

您按月付费,计费依据是您处理的文本的字符数量。Amazon Polly 的标准语音定价为:对于超出免费套餐的语音或语音标记请求,每 100 万个字符 4.00 USD。Amazon Polly 的神经语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 16.00 USD。Amazon Polly 的长格式语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 100.00 USD。 Amazon Polly 的生成式语音定价为:对于超出免费套餐的语音请求,每 100 万个字符 30 USD。

每月数百万个字符

对于 Amazon Polly 的标准语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 500 万个字符服务。对于神经语音,从您提交第一个语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 100 万个字符服务。对于长格式语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 50 万个字符服务。 对于生成式语音,从您提交第一个 Polly 语音请求起 12 个月内,针对该类请求,免费套餐每个月提供 10 万字符的服务。

<
使用指南
>
Step 1 - Sign up for an Amazon Web Services account
设置并登录您的 AWS 账户 观看网络研讨会并阅读文档 登录 Polly 控制台并开始构建。
<
依赖服务
>
<
产品问答
>
?
什么是 Amazon Transcribe?
Amazon Transcribe 是一项 AWS 人工智能(AI)服务,使您能够轻松实现语音转文本功能。采用自动语音识别(ASR)技术,您可以将 Amazon Transcribe 用于各种业务应用程序,包括转录基于语音的客户服务通话、生成音频/视频内容字幕,以及对音频/视频内容执行(基于文本的)内容分析。
?
Amazon Transcribe 如何与其他 AWS 产品交互?
Amazon Transcribe 可以将音频输入转换为文本,这为开发基于语音输入的各种文本分析应用程序打开了方便之门。例如,通过将 Amazon Comprehend 用于来自 Amazon Transcribe 的转换后文本数据,您可以进行情绪分析或提取实体和关键短语。同样,通过将 Amazon Translate 与 Amazon Poly 集成,您可以接收一种语言的语音输入,然后将其翻译为另一种语言并生成语音输出,从而有效地实现多种语言对话。还可以将 AmazonTranscribe与 Amazon Kendra 或AmazonOpenSearch 集成,以便在音频/视频库内编写索引并执行基于文本的搜索。要了解更多信息,请查看实时呼叫分析和座席协助、呼叫后分析、媒体搜索或内容分析解决方案。
?
我在使用 Amazon Transcribe 之前还应了解什么?
Amazon Transcribe 旨在处理各种语音和声学特征,包括音量、音调和语速的变化。音频信号的质量和内容(包括但不限于背景噪音、扬声器重叠、口音或一个音频文件内语言间的切换等因素)可能会影响服务输出的准确性。我们在不断更新服务,以改进其适应其他声音变化和内容类型的能力, 使用 Amazon Transcribe
<
关于我们
>
亚马逊云科技(Amazon Web Services,简称AWS)是全球领先的云计算服务提供商,提供包括计算、存储、数据库、分析、机器学习、物联网、移动、安全、混合云、虚拟和增强现实等在内的广泛服务。AWS在全球34个地理区域内运营108个可用区,服务超过200个国家和地区,帮助企业、开发者和政府机构构建灵活、可靠、可扩展的云基础设施。作为亚马逊公司的一部分,AWS致力于提供创新的云解决方案,支持客户实现数字化转型。
联系信息
服务时间: 早9:00-晚8:00 (法定假期除外)
电话号码: +86 (10) 1010 0866
网页在线客服: 咨询

AWS 云计算

Amazon Web Services(AWS)是全球最全面、应用最广泛的云,从全球数据中心提供超过 200 项功能齐全的服务。数百万客户(包括增长最快速的初创公司、最大型企业和主要的政府机构)都在使用 AWS 来降低成本、提高敏捷性并加速创新。

 

 

<
合作案例
>
engie ascender caratlane
<
最可能同场景使用的其他API
>