Amazon 文本数据提取服务-Textract
专用API
服务商:
亚马逊云厂商
【更新时间: 2024.06.18】
Amazon Textract是一种机器学习服务,能够自动从扫描的文档中提取文本、手写内容、布局元素和数据。它超越了传统的光学字符识别,能够识别、理解和提取文档中的特定数据。Textract文本提取器支持多种文档格式。
咨询
去服务商官网采购>
|
服务星级:2星
浏览次数
59
采购人数
0
试用次数
0
SLA: N/A
响应: N/A
适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
|
- API详情
- 定价
- 使用指南
- 常见 FAQ
- 关于我们
- 相关推荐
什么是Textract的Amazon 文本数据提取服务?
Amazon Textract 是一种高度先进的文本提取器,它使用机器学习技术从扫描文档中自动提取文本、手写内容、布局元素和数据。这项服务超越了传统的OCR技术,能够识别文本、理解和提取文档中的具体数据,从而显著提高了数据处理的效率和准确性。
Textract文本提取器支持多种文档格式,包括PDF、TIFF、PNG和JPEG,使其成为金融服务、医疗保健、公共部门等多个领域的理想选择。用户可以通过AWS管理控制台、AWS CLI或AWS SDK轻松使用这项服务,快速提取关键业务数据,如金融表格中的抵押贷款利率、申请人姓名和发票总额。
此外,Textract文本提取器还提供了强大的自定义功能,允许用户根据自己的业务需求定制预训练模型,以满足特定的文档处理需求。这意味着用户可以快速自动化文档处理流程,无论是处理贷款还是从发票和收据中提取信息,都能够在几分钟内完成,而不是之前的几小时甚至几天。
什么是Textract的Amazon 文本数据提取服务?
Textract的Amazon 文本数据提取服务有哪些核心功能?
-
文本、手写和布局元素提取:智能化文本处理能够从文档中提取文本、手写内容和布局元素,如段落、标题、列表、页眉、页脚等,实用的文本工具。
-
边界框坐标返回:所有提取的数据都会返回边界框坐标(多边形框架),帮助用户确定每一段已识别的数据在文档中的具体位置。
-
置信度分数:Amazon Textract还为它识别的所有内容返回置信度分数,以便用户可以根据这些分数就如何使用结果做出明智的决定。
-
自定义查询:允许用户自定义预训练的模型,以提高特定业务文档类型的提取准确性。
-
光学字符识别(OCR):自动从文档和图像中检测并识别打印文本和手写文本,应用OCR提升办公效率。
-
表格数据提取:能够识别文档中的表格,并保留表格的结构和其中的数据关联。
-
签名检测:能够检测文档或各种图像及AI图像上的签名,并返回签名的位置和置信度分数。
-
基于查询的抽取:允许用户以自然语言的形式指定所需的数据,并自动从文档中提取这些信息。
-
分析贷款(Analyze Lending API):专门用于从贷款包中提取信息的实用文本处理API轻松实现业务需求。
-
发票和收据提取:高效票据和收据的识别,并自动提取相关数据。
-
身份证件提取(Analyze ID):从身份文档中自动提取信息,如姓名、地址、有效期等。
Textract的Amazon 文本数据提取服务的技术原理是什么?
Textract的Amazon 文本数据提取服务的核心优势是什么?
-
:textract文本提取器不仅仅是OCR,它能识别、理解并提取文档中的特定数据,包括表格数据提取和签名检测。
-
支持多种文档格式:textract文本提取器支持PDF、TIFF、PNG和JPEG等多种文档格式,适用于金融服务、医疗保健、公共部门等多个领域。
-
易于集成:用户可以通过AWS管理控制台、AWS CLI或AWS SDK轻松使用textract文本提取器,快速提取关键业务数据。
-
自定义预训练模型:textract文本提取器允许用户自定义预训练功能,以满足特定的文档处理需求。
-
快速处理能力:textract文本提取器可以在几分钟内提取数据,而不再需要耗费几小时甚至几天的时间。
-
数据安全与合规:使用数据隐私、加密和合规性标准安全地自动处理数据。
-
低成本:使用 textract文本提取器,您只需为分析文档付费,没有最低费用或预付费用,采用分级定价模式。
-
持续学习与更新:textract文本提取器始终从新数据进行学习,Amazon 会不断向此服务添加新功能。
-
异步与同步处理:textract文本提取器提供同步处理,可以分析延迟至关重要的应用程序的单页文档,同时也提供异步操作以将支持扩展到多页文档。
-
与其他AWS服务集成
在哪些场景会用到Textract的Amazon 文本数据提取服务?
您按月付费,计费依据是您处理的文本的字符数量。Amazon Polly 的标准语音定价为:对于超出免费套餐的语音或语音标记请求,每 100 万个字符 4.00 USD。Amazon Polly 的神经语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 16.00 USD。Amazon Polly 的长格式语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 100.00 USD。 Amazon Polly 的生成式语音定价为:对于超出免费套餐的语音请求,每 100 万个字符 30 USD。
对于 Amazon Polly 的标准语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 500 万个字符服务。对于神经语音,从您提交第一个语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 100 万个字符服务。对于长格式语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 50 万个字符服务。 对于生成式语音,从您提交第一个 Polly 语音请求起 12 个月内,针对该类请求,免费套餐每个月提供 10 万字符的服务。
设置并登录您的 AWS 账户 | 观看网络研讨会并阅读文档。 | 登录 Polly 控制台并开始构建。 |
AWS 云计算
Amazon Web Services(AWS)是全球最全面、应用最广泛的云,从全球数据中心提供超过 200 项功能齐全的服务。数百万客户(包括增长最快速的初创公司、最大型企业和主要的政府机构)都在使用 AWS 来降低成本、提高敏捷性并加速创新。
您按月付费,计费依据是您处理的文本的字符数量。Amazon Polly 的标准语音定价为:对于超出免费套餐的语音或语音标记请求,每 100 万个字符 4.00 USD。Amazon Polly 的神经语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 16.00 USD。Amazon Polly 的长格式语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 100.00 USD。 Amazon Polly 的生成式语音定价为:对于超出免费套餐的语音请求,每 100 万个字符 30 USD。
对于 Amazon Polly 的标准语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 500 万个字符服务。对于神经语音,从您提交第一个语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 100 万个字符服务。对于长格式语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 50 万个字符服务。 对于生成式语音,从您提交第一个 Polly 语音请求起 12 个月内,针对该类请求,免费套餐每个月提供 10 万字符的服务。
设置并登录您的 AWS 账户 | 观看网络研讨会并阅读文档。 | 登录 Polly 控制台并开始构建。 |
AWS 云计算
Amazon Web Services(AWS)是全球最全面、应用最广泛的云,从全球数据中心提供超过 200 项功能齐全的服务。数百万客户(包括增长最快速的初创公司、最大型企业和主要的政府机构)都在使用 AWS 来降低成本、提高敏捷性并加速创新。