文本数据识别-Amazon

文本数据识别-Amazon

专用API
【更新时间: 2024.06.18】 Amazon Textract 是一项机器学习(ML)服务,可从扫描的文档中自动识别文本、手写内容和数据。
服务星级:2星
⭐ ⭐ 🌟 🌟 🌟 🌟 🌟
调用次数
0
集成人数
0
商用人数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是Amazon的文本数据识别?

"Amazon 文本数据识别API"(通常简称为“Amazon Textract”)是Amazon Web Services (AWS)提供的一种机器学习(ML)服务。它能够自动从扫描的文档中提取文本、手写内容、布局元素和数据。Amazon Textract超越了传统的光学字符识别(OCR)技术,因为它不仅能够识别文本,还能从表单和表格中识别、理解和提取数据。

什么是Amazon的文本数据识别?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用Amazon的文本数据识别,从而实现程序的自动化交互,提高服务效率。

Amazon的文本数据识别有哪些核心功能?

  1. 文本、手写和布局元素提取智能化文本处理能够从文档中提取文本、手写内容和布局元素,如段落、标题、列表、页眉、页脚等,实用的文本工具

  2. 边界框坐标返回:所有提取的数据都会返回边界框坐标(多边形框架),帮助用户确定每一段已识别的数据在文档中的具体位置。

  3. 置信度分数:Amazon Textract还为它识别的所有内容返回置信度分数,以便用户可以根据这些分数就如何使用结果做出明智的决定。

  4. 自定义查询:允许用户自定义预训练的模型,以提高特定业务文档类型的提取准确性。

  5. 光学字符识别(OCR):自动从文档和图像中检测并识别打印文本和手写文本,应用OCR提升办公效率

  6. 表格数据提取:能够识别文档中的表格,并保留表格的结构和其中的数据关联。

  7. 签名检测:能够检测文档或各种图像及AI图像上的签名,并返回签名的位置和置信度分数。

  8. 基于查询的抽取:允许用户以自然语言的形式指定所需的数据,并自动从文档中提取这些信息。

  9. 分析贷款(Analyze Lending API):专门用于从贷款包中提取信息的实用文本处理API轻松实现业务需求

  10. 发票和收据提取高效票据和收据的识别,并自动提取相关数据。

  11. 身份证件提取(Analyze ID):从身份文档中自动提取信息,如姓名、地址、有效期等。

Amazon的文本数据识别的技术原理是什么?

Amazon Textract 是一种机器学习(ML)服务,从扫描的文档(如 PDF)中自动提取文本、手写内容、布局元素和数据。它不是简单的光学字符识别技术(OCR),而是可以识别、理解并提取文档中的特定数据。如今,许多公司都需要从扫描文档(如 PDF、图片、表格和表单)中手动提取数据,或通过简单的 OCR 软件,而这些软件需要手动配置,当表单发生变化时,往往还需要重新配置。为了避免这些昂贵的手动流程,Textract 使用 ML 来读取和处理任何类型的文档,可以精确地提取文本、手写字、表格和其他数据,不需要任何手动工作,是应用程序开发中不可或缺的开放API,您可以使用我们的预训练或自定义功能来快速自动处理文档,无论是自动处理贷款还是从发票和收据中提取信息。Textract 使您能够自定义我们的预训练功能,实用的文本API,助您轻松实现业务需求。Textract 可以在几分钟内提取数据,而不再需要耗费几小时甚至几天的时间。
 
 

Amazon的文本数据识别的核心优势是什么?

1. 提升业务效率并加快决策速度,同时降低成本。

2. 从几乎任何文档中高度准确地提取关键见解。

3. 纵向扩展或缩减文档处理管道,可以快速适应市场API市场需求

4. 使用数据隐私、加密和合规性标准安全地自动处理数据

在哪些场景会用到Amazon的文本数据识别?

1. 金融服务

准确提取有关金融科技的抵押贷款利率、申请人姓名和发票总额等各种金融表格的关键业务数据,以在数分钟内处理贷款和抵押贷款申请。

2. 医护及生命科学

从健康摄食表单、保险金申请和预授权表单中提取重要患者数据,结合医疗大模型可以更好地为患者和保险公司服务。保持数据在其原始上下文中组织有序,免去对输出的人工审查。

3. 公共部门

轻松地从政府相关表格中提取相关数据,例如小企业贷款、联邦税表或商业申请,具有高度的准确性。

<
产品价格
>
按实际使用量付费模式

您按月付费,计费依据是您处理的文本的字符数量。Amazon Polly 的标准语音定价为:对于超出免费套餐的语音或语音标记请求,每 100 万个字符 4.00 USD。Amazon Polly 的神经语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 16.00 USD。Amazon Polly 的长格式语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 100.00 USD。 Amazon Polly 的生成式语音定价为:对于超出免费套餐的语音请求,每 100 万个字符 30 USD。

每月数百万个字符

对于 Amazon Polly 的标准语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 500 万个字符服务。对于神经语音,从您提交第一个语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 100 万个字符服务。对于长格式语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 50 万个字符服务。 对于生成式语音,从您提交第一个 Polly 语音请求起 12 个月内,针对该类请求,免费套餐每个月提供 10 万字符的服务。

<
使用指南
>
Step 1 - Sign up for an Amazon Web Services account
设置并登录您的 AWS 账户 观看网络研讨会并阅读文档 登录 Polly 控制台并开始构建。
<
产品问答
>
?
目前,哪些区域提供 Amazon Polly 服务?
请参阅 AWS 区域服务列表了解支持 Amazon Polly 标准语音的所有区域。这些区域的以下子集支持神经语音:美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、加拿大(中部)、亚太地区(东京)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)、非洲(开普敦)、欧洲(伦敦)、欧洲(法兰克福)、欧洲(爱尔兰)亚太地区和 AWS GovCloud (美国西部)。
?
如何开始使用 Amazon Polly?
您只需登录到您的 AWS 账户,前往 Amazon Polly 控制台(AWS 控制台的一部分),即可开始使用该产品。接下来,您可以使用控制台输入任何文本并收听生成的语音,或将其另存为音频文件。
?
Amazon Polly 支持哪些音频格式?
借助 Amazon Polly,您可以近乎实时地将音频流式传输给您的用户。Amazon Polly 还提供多种采样率供您选择,便于您为应用程序优化带宽和音频质量。Amazon Polly 支持 MP3、Vorbis 和原始 PCM 音频流格式。
?
Amazon Polly 是否有 AWS 服务限制?
为了帮助保证 AWS 资源的可用性并最大限度降低新客户的账单风险,AWS 对每个账户均设置有服务限制。使用 Amazon Polly 为应用程序提供高质量语音输出功能时,需遵循默认的服务限制,包括对限制设置、操作和语音合成标记语言 (SSML) 的使用的限制。有关详情,请参阅《Amazon Polly 开发人员指南》中的 Limits in Amazon Polly。将 Polly Amazon 与其他 AWS 服务(例如可以高效进行批处理的 AWS Batch)结合使用,您可以在这些服务的限制内充分利用 Amazon Polly。
?
Amazon Polly 支持哪些编程语言?
Amazon Polly 支持 AWS 软件开发工具包中包含的所有编程语言(Java、Node.js、.NET、PHP、Python、Ruby、Go 和 C++)以及 AWS 移动软件开发工具包中包含的所有编程语言 (iOS/Android)。Amazon Polly 还支持 HTTP API,因此您可以实施自己的访问层。
<
关于我们
>
亚马逊云科技(Amazon Web Services,简称AWS)是全球领先的云计算服务提供商,提供包括计算、存储、数据库、分析、机器学习、物联网、移动、安全、混合云、虚拟和增强现实等在内的广泛服务。AWS在全球34个地理区域内运营108个可用区,服务超过200个国家和地区,帮助企业、开发者和政府机构构建灵活、可靠、可扩展的云基础设施。作为亚马逊公司的一部分,AWS致力于提供创新的云解决方案,支持客户实现数字化转型。
联系信息
服务时间: 早9:00-晚8:00 (法定假期除外)
电话号码: +86 (10) 1010 0866
网页在线客服: 咨询

AWS 云计算

Amazon Web Services(AWS)是全球最全面、应用最广泛的云,从全球数据中心提供超过 200 项功能齐全的服务。数百万客户(包括增长最快速的初创公司、最大型企业和主要的政府机构)都在使用 AWS 来降低成本、提高敏捷性并加速创新。

 

 

<
最可能同场景使用的其他API
>
API接口列表
<
产品价格
>
按实际使用量付费模式

您按月付费,计费依据是您处理的文本的字符数量。Amazon Polly 的标准语音定价为:对于超出免费套餐的语音或语音标记请求,每 100 万个字符 4.00 USD。Amazon Polly 的神经语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 16.00 USD。Amazon Polly 的长格式语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 100.00 USD。 Amazon Polly 的生成式语音定价为:对于超出免费套餐的语音请求,每 100 万个字符 30 USD。

每月数百万个字符

对于 Amazon Polly 的标准语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 500 万个字符服务。对于神经语音,从您提交第一个语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 100 万个字符服务。对于长格式语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 50 万个字符服务。 对于生成式语音,从您提交第一个 Polly 语音请求起 12 个月内,针对该类请求,免费套餐每个月提供 10 万字符的服务。

<
使用指南
>
Step 1 - Sign up for an Amazon Web Services account
设置并登录您的 AWS 账户 观看网络研讨会并阅读文档 登录 Polly 控制台并开始构建。
<
依赖服务
>
<
产品问答
>
?
目前,哪些区域提供 Amazon Polly 服务?
请参阅 AWS 区域服务列表了解支持 Amazon Polly 标准语音的所有区域。这些区域的以下子集支持神经语音:美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、加拿大(中部)、亚太地区(东京)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)、非洲(开普敦)、欧洲(伦敦)、欧洲(法兰克福)、欧洲(爱尔兰)亚太地区和 AWS GovCloud (美国西部)。
?
如何开始使用 Amazon Polly?
您只需登录到您的 AWS 账户,前往 Amazon Polly 控制台(AWS 控制台的一部分),即可开始使用该产品。接下来,您可以使用控制台输入任何文本并收听生成的语音,或将其另存为音频文件。
?
Amazon Polly 支持哪些音频格式?
借助 Amazon Polly,您可以近乎实时地将音频流式传输给您的用户。Amazon Polly 还提供多种采样率供您选择,便于您为应用程序优化带宽和音频质量。Amazon Polly 支持 MP3、Vorbis 和原始 PCM 音频流格式。
?
Amazon Polly 是否有 AWS 服务限制?
为了帮助保证 AWS 资源的可用性并最大限度降低新客户的账单风险,AWS 对每个账户均设置有服务限制。使用 Amazon Polly 为应用程序提供高质量语音输出功能时,需遵循默认的服务限制,包括对限制设置、操作和语音合成标记语言 (SSML) 的使用的限制。有关详情,请参阅《Amazon Polly 开发人员指南》中的 Limits in Amazon Polly。将 Polly Amazon 与其他 AWS 服务(例如可以高效进行批处理的 AWS Batch)结合使用,您可以在这些服务的限制内充分利用 Amazon Polly。
?
Amazon Polly 支持哪些编程语言?
Amazon Polly 支持 AWS 软件开发工具包中包含的所有编程语言(Java、Node.js、.NET、PHP、Python、Ruby、Go 和 C++)以及 AWS 移动软件开发工具包中包含的所有编程语言 (iOS/Android)。Amazon Polly 还支持 HTTP API,因此您可以实施自己的访问层。
<
关于我们
>
亚马逊云科技(Amazon Web Services,简称AWS)是全球领先的云计算服务提供商,提供包括计算、存储、数据库、分析、机器学习、物联网、移动、安全、混合云、虚拟和增强现实等在内的广泛服务。AWS在全球34个地理区域内运营108个可用区,服务超过200个国家和地区,帮助企业、开发者和政府机构构建灵活、可靠、可扩展的云基础设施。作为亚马逊公司的一部分,AWS致力于提供创新的云解决方案,支持客户实现数字化转型。
联系信息
服务时间: 早9:00-晚8:00 (法定假期除外)
电话号码: +86 (10) 1010 0866
网页在线客服: 咨询

AWS 云计算

Amazon Web Services(AWS)是全球最全面、应用最广泛的云,从全球数据中心提供超过 200 项功能齐全的服务。数百万客户(包括增长最快速的初创公司、最大型企业和主要的政府机构)都在使用 AWS 来降低成本、提高敏捷性并加速创新。

 

 

<
合作案例
>
engie ascender caratlane
<
最可能同场景使用的其他API
>