Amazon 媒体分析服务-Rekognition

Amazon 媒体分析服务-Rekognition

专用API
【更新时间: 2024.06.18】 使用经过验证的、高度可扩展且无需机器学习专业知识就可使用的深度学习技术,Amazon Rekognition 可以轻松将图像和视频分析功能添加到您的应用程序中。借助 Amazon Rekognition,您可以在图...
服务星级:2星
⭐ ⭐ 🌟 🌟 🌟 🌟 🌟
调用次数
0
集成人数
0
商用人数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是Rekognition的Amazon 媒体分析服务?

Amazon 媒体分析服务-Rekognition利用机器学习自动执行图像识别和视频分析并降低成本。

什么是Rekognition的Amazon 媒体分析服务?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用Rekognition的Amazon 媒体分析服务,从而实现程序的自动化交互,提高服务效率。

Rekognition的Amazon 媒体分析服务有哪些核心功能?

内容审核 面孔检测和分析 面孔搜索和验证

人脸活动

可在面部验证期间检测出真实用户,并在几秒钟内阻止使用欺诈手段的不法分子。

确定一张面孔与另一张照片或从您的私有图片库中的照片的相似度。

面孔检测和分析

检测图像和视频中出现的面孔,并识别每张面孔的属性,如睁开的双眼、是否佩戴眼镜和面部毛发。

内容审核 自定义标签 文本检测

内容审核

检测图像和视频中潜在的不安全、不适宜或有害内容。

自定义标签

使用自动机器学习 (AutoML) 检测品牌徽标等自定义对象,只需 10 张图像即可训练您的模型。

文本检测

从路牌、社交媒体帖子和产品包装的图像和视频中提取歪斜和扭曲的文本。

标签 视频片段检测 名人识别

标签

检测物体、场景、活动、地标、主色和图像质量。

视频片段检测

检测视频中的关键片段,如黑帧、片头或片尾字幕、镜头号码牌、彩色和镜头。

名人识别

识别知名人士,为媒体、营销和广告给照片和录像编目录。

Rekognition的Amazon 媒体分析服务的核心优势是什么?

1. 无需从头开始构建机器学习 (ML) 模型和基础设施,即可将预先训练或可自定义的计算机视觉 API 快速添加到您的应用程序中。

2. 在几秒钟内分析数以百万计的图像、串流和存储的视频,并使用人工智能 (AI) 增强人工审核任务。

3. 借助完全托管式 AI 功能,根据您的业务需求进行纵向扩展和缩减,并且只需为您分析的图像和视频付费。

在哪些场景会用到Rekognition的Amazon 媒体分析服务?

1. 检测不适宜的内容

根据通用或特定于业务的标准和实践,快速、准确地识别图像和视频资产中的不安全或不适宜的内容。

2. 在线验证身份

在您的用户引导和身份验证工作流程中使用面部比较和分析,以远程验证已选择加入的用户的身份。

3. 简化媒体分析

自动检测关键视频片段,以减少视频广告插入、内容运营和内容制作的时间、精力和成本。

4. 发送互联家居智能提示

在直播视频流式传输中检测到所需对象时,及时发出可操作的提示。创建家居自动化体验,例如在检测到人时自动开灯。

<
产品价格
>
按实际使用量付费模式

您按月付费,计费依据是您处理的文本的字符数量。Amazon Polly 的标准语音定价为:对于超出免费套餐的语音或语音标记请求,每 100 万个字符 4.00 USD。Amazon Polly 的神经语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 16.00 USD。Amazon Polly 的长格式语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 100.00 USD。 Amazon Polly 的生成式语音定价为:对于超出免费套餐的语音请求,每 100 万个字符 30 USD。

每月数百万个字符

对于 Amazon Polly 的标准语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 500 万个字符服务。对于神经语音,从您提交第一个语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 100 万个字符服务。对于长格式语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 50 万个字符服务。 对于生成式语音,从您提交第一个 Polly 语音请求起 12 个月内,针对该类请求,免费套餐每个月提供 10 万字符的服务。

<
产品问答
>
?
什么是语音标记?
语音标记用于补充从输入文本生成的合成语音。将这一元数据流与合成语音音频流配合使用,客户能够在应用程序中提供增强的视觉体验,例如语音同步动画或者卡拉 ok 式突出提示。 Amazon Polly 使用以下四种元素来生成语音标记: 语句,指明要朗读的输入文本中的语句元素; 文字,指明文本中的文字元素; 视位,描述与发出的声音对应的嘴唇形状; SSML,描述文本中使用的 SSML 元素。 语音标记以 JSON 流(具体指一组由新线隔开的独立 JSON 对象)的形式交付,在使用合成语音方法处理语音标记类参数时,涵盖上面一个到全部四个元素中的任何位置。有关更多信息,请参阅《Amazon Polly 开发人员指南》。
?
Amazon Polly 可以提供哪些功能?
您可以使用标准化的语音合成标记语言 (SSML) 控制语音的各个方面,如发音、音量、音调、语速等。您可以使用新闻播音员风格为某些神经语音合成语音,使其听起来像电视或无线电新闻播音员。您可以根据音频流中的元数据,检测用户听到文本中的特定文字或语句的时间。这让开发人员能够将突出显示的图形和动画(例如头像的嘴唇动作)与合成语音同步。您可以使用自定义字典修改公司名称、首字母缩略词、外来词和新词等特定词语的发音,例如“P!nk”、“ROTFL”和“C'est la vie”(使用非法语语音说话时)。
?
Amazon Polly 如何与其他 AWS 产品配合使用?
将 Amazon Polly 与 Amazon Lex 结合使用,开发人员可以为应用程序构建功能齐全的语音用户界面。与 Amazon Connect 结合,Amazon Polly 语音可以用于构建基于云的自助呼叫中心服务。此外,移动应用程序和物联网 (IoT) 解决方案的开发人员还可以利用 Amazon Polly 将语音输出添加到自己的系统中。
?
目前,哪些区域提供 Amazon Polly 服务?
请参阅 AWS 区域服务列表了解支持 Amazon Polly 标准语音的所有区域。这些区域的以下子集支持神经语音:美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、加拿大(中部)、亚太地区(东京)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)、非洲(开普敦)、欧洲(伦敦)、欧洲(法兰克福)、欧洲(爱尔兰)亚太地区和 AWS GovCloud (美国西部)。
?
Amazon Polly 支持哪些编程语言?
Amazon Polly 支持 AWS 软件开发工具包中包含的所有编程语言(Java、Node.js、.NET、PHP、Python、Ruby、Go 和 C++)以及 AWS 移动软件开发工具包中包含的所有编程语言 (iOS/Android)。Amazon Polly 还支持 HTTP API,因此您可以实施自己的访问层。
<
关于我们
>
亚马逊云科技(Amazon Web Services,简称AWS)是全球领先的云计算服务提供商,提供包括计算、存储、数据库、分析、机器学习、物联网、移动、安全、混合云、虚拟和增强现实等在内的广泛服务。AWS在全球34个地理区域内运营108个可用区,服务超过200个国家和地区,帮助企业、开发者和政府机构构建灵活、可靠、可扩展的云基础设施。作为亚马逊公司的一部分,AWS致力于提供创新的云解决方案,支持客户实现数字化转型。
联系信息
服务时间: 早9:00-晚8:00 (法定假期除外)
电话号码: +86 (10) 1010 0866
网页在线客服: 咨询

AWS 云计算

Amazon Web Services(AWS)是全球最全面、应用最广泛的云,从全球数据中心提供超过 200 项功能齐全的服务。数百万客户(包括增长最快速的初创公司、最大型企业和主要的政府机构)都在使用 AWS 来降低成本、提高敏捷性并加速创新。

 

 

<
最可能同场景使用的其他API
>
API接口列表
<
产品价格
>
按实际使用量付费模式

您按月付费,计费依据是您处理的文本的字符数量。Amazon Polly 的标准语音定价为:对于超出免费套餐的语音或语音标记请求,每 100 万个字符 4.00 USD。Amazon Polly 的神经语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 16.00 USD。Amazon Polly 的长格式语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 100.00 USD。 Amazon Polly 的生成式语音定价为:对于超出免费套餐的语音请求,每 100 万个字符 30 USD。

每月数百万个字符

对于 Amazon Polly 的标准语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 500 万个字符服务。对于神经语音,从您提交第一个语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 100 万个字符服务。对于长格式语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 50 万个字符服务。 对于生成式语音,从您提交第一个 Polly 语音请求起 12 个月内,针对该类请求,免费套餐每个月提供 10 万字符的服务。

<
依赖服务
>
<
产品问答
>
?
什么是语音标记?
语音标记用于补充从输入文本生成的合成语音。将这一元数据流与合成语音音频流配合使用,客户能够在应用程序中提供增强的视觉体验,例如语音同步动画或者卡拉 ok 式突出提示。 Amazon Polly 使用以下四种元素来生成语音标记: 语句,指明要朗读的输入文本中的语句元素; 文字,指明文本中的文字元素; 视位,描述与发出的声音对应的嘴唇形状; SSML,描述文本中使用的 SSML 元素。 语音标记以 JSON 流(具体指一组由新线隔开的独立 JSON 对象)的形式交付,在使用合成语音方法处理语音标记类参数时,涵盖上面一个到全部四个元素中的任何位置。有关更多信息,请参阅《Amazon Polly 开发人员指南》。
?
Amazon Polly 可以提供哪些功能?
您可以使用标准化的语音合成标记语言 (SSML) 控制语音的各个方面,如发音、音量、音调、语速等。您可以使用新闻播音员风格为某些神经语音合成语音,使其听起来像电视或无线电新闻播音员。您可以根据音频流中的元数据,检测用户听到文本中的特定文字或语句的时间。这让开发人员能够将突出显示的图形和动画(例如头像的嘴唇动作)与合成语音同步。您可以使用自定义字典修改公司名称、首字母缩略词、外来词和新词等特定词语的发音,例如“P!nk”、“ROTFL”和“C'est la vie”(使用非法语语音说话时)。
?
Amazon Polly 如何与其他 AWS 产品配合使用?
将 Amazon Polly 与 Amazon Lex 结合使用,开发人员可以为应用程序构建功能齐全的语音用户界面。与 Amazon Connect 结合,Amazon Polly 语音可以用于构建基于云的自助呼叫中心服务。此外,移动应用程序和物联网 (IoT) 解决方案的开发人员还可以利用 Amazon Polly 将语音输出添加到自己的系统中。
?
目前,哪些区域提供 Amazon Polly 服务?
请参阅 AWS 区域服务列表了解支持 Amazon Polly 标准语音的所有区域。这些区域的以下子集支持神经语音:美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、加拿大(中部)、亚太地区(东京)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)、非洲(开普敦)、欧洲(伦敦)、欧洲(法兰克福)、欧洲(爱尔兰)亚太地区和 AWS GovCloud (美国西部)。
?
Amazon Polly 支持哪些编程语言?
Amazon Polly 支持 AWS 软件开发工具包中包含的所有编程语言(Java、Node.js、.NET、PHP、Python、Ruby、Go 和 C++)以及 AWS 移动软件开发工具包中包含的所有编程语言 (iOS/Android)。Amazon Polly 还支持 HTTP API,因此您可以实施自己的访问层。
<
关于我们
>
亚马逊云科技(Amazon Web Services,简称AWS)是全球领先的云计算服务提供商,提供包括计算、存储、数据库、分析、机器学习、物联网、移动、安全、混合云、虚拟和增强现实等在内的广泛服务。AWS在全球34个地理区域内运营108个可用区,服务超过200个国家和地区,帮助企业、开发者和政府机构构建灵活、可靠、可扩展的云基础设施。作为亚马逊公司的一部分,AWS致力于提供创新的云解决方案,支持客户实现数字化转型。
联系信息
服务时间: 早9:00-晚8:00 (法定假期除外)
电话号码: +86 (10) 1010 0866
网页在线客服: 咨询

AWS 云计算

Amazon Web Services(AWS)是全球最全面、应用最广泛的云,从全球数据中心提供超过 200 项功能齐全的服务。数百万客户(包括增长最快速的初创公司、最大型企业和主要的政府机构)都在使用 AWS 来降低成本、提高敏捷性并加速创新。

 

 

<
合作案例
>
engie ascender caratlane
<
最可能同场景使用的其他API
>