Amazon 文本数据提取服务-Textract

专用API

【更新时间: 2024.06.18】 Amazon Textract是一种机器学习服务，能够自动从扫描的文档中提取文本、手写内容、布局元素和数据。它超越了传统的光学字符识别，能够识别、理解和提取文档中的特定数据。Textract文本提取器支持多种文档格式。

咨询去服务商官网采购>

浏览次数

158

采购人数

试用次数

SLA: N/A

响应: N/A

适用于个人&企业

书签名称

确定

相似API

OCR二维码识别-API Space

OCR 二维码识别接口-API Space，可针对图片里的二维码与条形码展开检测及识别操作，进而精准返回其中所存储的文字内容，能够高效且准确地帮助用户提取图片中二维码、条形码的关键信息，为相关应用提供有力支持。

MicrosoftAzure智能无广告位置搜寻

Microsoft Azure的一项人工智能服务，为您的用户提供安全、无广告的位置搜索，显示来自网络结果、图像、本地企业、新闻和图像的相关信息照片。

语音转文本-IBM Watson

205

IBM Watson 语音转文本，它主要采用了由人工智能所驱动的先进语音识别与转录技术。能够高效且精准地将各种语音内容转换为清晰准确的文本形式，以便于后续的处理、分析和使用，极大地提升了语音转换的效率和质量。

API详情
定价
使用指南
常见 FAQ
关于我们
相关推荐

产品介绍

什么是Textract的Amazon 文本数据提取服务?

Amazon Textract 是一种高度先进的文本提取器，它使用机器学习技术从扫描文档中自动提取文本、手写内容、布局元素和数据。这项服务超越了传统的OCR技术，能够识别文本、理解和提取文档中的具体数据，从而显著提高了数据处理的效率和准确性。

Textract文本提取器支持多种文档格式，包括PDF、TIFF、PNG和JPEG，使其成为金融服务、医疗保健、公共部门等多个领域的理想选择。用户可以通过AWS管理控制台、AWS CLI或AWS SDK轻松使用这项服务，快速提取关键业务数据，如金融表格中的抵押贷款利率、申请人姓名和发票总额。

此外，Textract文本提取器还提供了强大的自定义功能，允许用户根据自己的业务需求定制预训练模型，以满足特定的文档处理需求。这意味着用户可以快速自动化文档处理流程，无论是处理贷款还是从发票和收据中提取信息，都能够在几分钟内完成，而不是之前的几小时甚至几天。

Textract的Amazon 文本数据提取服务有哪些核心功能？

一、文本、手写和布局元素提取：

Amazon Textract能够从文档中提取文本、手写内容和布局元素，如段落、标题、列表、页眉、页脚等

二、边界框坐标返回

所有提取的数据都会返回边界框坐标（多边形框架），帮助用户确定每一段已识别的数据在文档中的具体位置

三、置信度分数

Amazon Textract还为它识别的所有内容返回置信度分数，以便用户可以根据这些分数就如何使用结果做出明智的决定

四、自定义查询

允许用户自定义预训练的模型，以提高特定业务文档类型的提取准确性

五、光学字符识别（OCR）

自动从文档和图像中检测并识别打印文本和手写文本，应用OCR提升办公效率

六、表格数据提取

能够识别文档中的表格，并保留表格的结构和其中的数据关联

Textract的Amazon 文本数据提取服务的技术原理是什么？

Amazon Textract 是一种机器学习（ML）服务，它作为强大的textract文本提取器，从扫描的文档（如 PDF）中自动提取文本、手写内容、布局元素和数据。与传统的光学字符识别技术（OCR）不同，textract文本提取器可以识别、理解并提取文档中的特定数据。在当今的商业环境中，许多公司都需要从扫描文档（如 PDF、图片、表格和表单）中手动提取数据，或依赖需要手动配置的简单OCR软件，这些软件在表单发生变化时往往需要重新配置。为了避免这些昂贵且耗时的手动流程，textract文本提取器使用 ML 来读取和处理任何类型的文档，可以精确地提取文本、手写字、表格和其他数据，而不需要任何手动工作。

作为应用程序开发中不可或缺的开放API，textract文本提取器提供了实用的文本API，使您可以使用我们的预训练或自定义功能来快速自动处理文档。无论是自动处理贷款还是从发票和收据中提取信息，textract文本提取器都能助您轻松实现业务需求。与传统方法相比，textract文本提取器可以在几分钟内提取数据，而不再需要耗费几小时甚至几天的时间，显著提高了工作效率。

Textract的Amazon 文本数据提取服务的核心优势是什么？

高精度文本识别 textract文本提取器不仅仅是OCR，它能识别、理解并提取文档中的特定数据，包括表格数据提取和签名检测
	支持多种文档格式 textract文本提取器支持PDF、TIFF、PNG和JPEG等多种文档格式，适用于金融服务、医疗保健、公共部门等多个领域
易于集成用户可以通过AWS管理控制台、AWS CLI或AWS SDK轻松使用textract文本提取器，快速提取关键业务数据
	自定义预训练模型 textract文本提取器允许用户自定义预训练功能，以满足特定的文档处理需求。
快速处理能力 textract文本提取器可以在几分钟内提取数据，而不再需要耗费几小时甚至几天的时间。
	数据安全与合规使用数据隐私、加密和合规性标准安全地自动处理数据。

在哪些场景会用到Textract的Amazon 文本数据提取服务？

1. 金融服务

准确提取有关金融科技的抵押贷款利率、申请人姓名和发票总额等各种金融表格的关键业务数据，以在数分钟内处理贷款和抵押贷款申请。

2. 医护及生命科学

从健康摄食表单、保险金申请和预授权表单中提取重要患者数据，结合医疗大模型可以更好地为患者和保险公司服务。保持数据在其原始上下文中组织有序，免去对输出的人工审查。

3. 公共部门

轻松地从政府相关表格中提取相关数据，例如小企业贷款、联邦税表或商业申请，具有高度的准确性。

产品价格

适用范围：

个人&企业

免费方式：

每月限免

定价方式：

按量（例如每次/元、每token/美元）, 支持定制

价格：

价格详情：

按实际使用量付费模式

您按月付费，计费依据是您处理的文本的字符数量。Amazon Polly 的标准语音定价为：对于超出免费套餐的语音或语音标记请求，每 100 万个字符 4.00 USD。Amazon Polly 的神经语音定价为：对于超出免费套餐的语音或请求的语音标记，每 100 万个字符 16.00 USD。Amazon Polly 的长格式语音定价为：对于超出免费套餐的语音或请求的语音标记，每 100 万个字符 100.00 USD。 Amazon Polly 的生成式语音定价为：对于超出免费套餐的语音请求，每 100 万个字符 30 USD。

每月数百万个字符

对于 Amazon Polly 的标准语音，从您提交第一个 Polly 语音或语音标记请求起 12 个月内，针对该类请求，免费套餐每个月提供 500 万个字符服务。对于神经语音，从您提交第一个语音或语音标记请求起 12 个月内，针对该类请求，免费套餐每个月提供 100 万个字符服务。对于长格式语音，从您提交第一个 Polly 语音或语音标记请求起 12 个月内，针对该类请求，免费套餐每个月提供 50 万个字符服务。对于生成式语音，从您提交第一个 Polly 语音请求起 12 个月内，针对该类请求，免费套餐每个月提供 10 万字符的服务。

使用指南


设置并登录您的 AWS 账户	观看网络研讨会并阅读文档。	登录 Polly 控制台并开始构建。

产品问答

目前，哪些区域提供 Amazon Polly 服务？

请参阅 AWS 区域服务列表了解支持 Amazon Polly 标准语音的所有区域。这些区域的以下子集支持神经语音：美国东部（弗吉尼亚北部）、美国西部（俄勒冈）、加拿大（中部）、亚太地区（东京）、亚太地区（首尔）、亚太地区（新加坡）、亚太地区（悉尼）、非洲（开普敦）、欧洲（伦敦）、欧洲（法兰克福）、欧洲（爱尔兰）亚太地区和 AWS GovCloud (美国西部)。

如何开始使用 Amazon Polly？

您只需登录到您的 AWS 账户，前往 Amazon Polly 控制台（AWS 控制台的一部分），即可开始使用该产品。接下来，您可以使用控制台输入任何文本并收听生成的语音，或将其另存为音频文件。

Amazon Polly 支持哪些音频格式？

借助 Amazon Polly，您可以近乎实时地将音频流式传输给您的用户。Amazon Polly 还提供多种采样率供您选择，便于您为应用程序优化带宽和音频质量。Amazon Polly 支持 MP3、Vorbis 和原始 PCM 音频流格式。

Amazon Polly 是否有 AWS 服务限制？

为了帮助保证 AWS 资源的可用性并最大限度降低新客户的账单风险，AWS 对每个账户均设置有服务限制。使用 Amazon Polly 为应用程序提供高质量语音输出功能时，需遵循默认的服务限制，包括对限制设置、操作和语音合成标记语言 (SSML) 的使用的限制。有关详情，请参阅《Amazon Polly 开发人员指南》中的 Limits in Amazon Polly。将 Polly Amazon 与其他 AWS 服务（例如可以高效进行批处理的 AWS Batch）结合使用，您可以在这些服务的限制内充分利用 Amazon Polly。

Amazon Polly 支持哪些编程语言？

Amazon Polly 支持 AWS 软件开发工具包中包含的所有编程语言（Java、Node.js、.NET、PHP、Python、Ruby、Go 和 C++）以及 AWS 移动软件开发工具包中包含的所有编程语言 (iOS/Android)。Amazon Polly 还支持 HTTP API，因此您可以实施自己的访问层。

每个文档可以提出多少查询？

查询是基于每页处理的，可以通过同步或异步操作使用查询提取信息。对于同步操作，每页最多支持15个查询。对于异步操作，每页最多支持30个查询

如何从Amazon Textract获得最佳结果？

确保文档使用Amazon Textract支持的语言（目前为英文、西班牙文、意大利文、葡萄牙文、法文、德文。手写、发票和收据、身份证件和查询处理仅支持英文）。提供尽可能高质量的图像，理想情况下至少为150 DPI。如果文档已经是Amazon Textract支持的文件格式（PDF、JPG、PNG），则在上传到Amazon Textract之前不要进行转换或下采样

Amazon Textract是否与AWS CloudTrail一起工作？

是的，Amazon Textract支持将以下操作作为CloudTrail事件记录 - DetectDocumentText、AnalyzeDocument、StartDocumentTextDetection、StartDocumentAnalysis、GetDocumentTextDetection和GetDocumentAnalysis

Amazon Textract的Analyze Document API有哪些特性？

Analyze Document API具有以下特性：表单、表格、查询、自定义查询、签名和布局。你可以独立使用这些特性，或将它们组合使用。使用表单提取数据（例如“姓名”和关联值“Jane Smith”）。使用表格提取组织在列和行中的表格数据。使用查询以自然语言问题的形式指定你需要从文档中提取的信息（例如，“客户名称是什么？”），并将答案（例如，“Jane Doe”）作为响应的一部分返回

关于我们

亚马逊云厂商

企业

亚马逊云科技（Amazon Web Services，简称AWS）是全球领先的云计算服务提供商，提供包括计算、存储、数据库、分析、机器学习、物联网、移动、安全、混合云、虚拟和增强现实等在内的广泛服务。AWS在全球34个地理区域内运营108个可用区，服务超过200个国家和地区，帮助企业、开发者和政府机构构建灵活、可靠、可扩展的云基础设施。作为亚马逊公司的一部分，AWS致力于提供创新的云解决方案，支持客户实现数字化转型。

联系信息

服务时间：早9:00-晚8:00 (法定假期除外)

电话号码： +86 (10) 1010 0866

网页在线客服：咨询

AWS 云计算

Amazon Web Services（AWS）是全球最全面、应用最广泛的云，从全球数据中心提供超过 200 项功能齐全的服务。数百万客户（包括增长最快速的初创公司、最大型企业和主要的政府机构）都在使用 AWS 来降低成本、提高敏捷性并加速创新。

最多的功能
从计算、存储和数据库等基础设施技术，到机器学习、人工智能、数据湖和分析以及物联网等新兴技术，AWS 提供的服务以及其中的功能比其他任何云服务提供商的都要多得多。这使得将现有应用程序迁移到云中并构建您可以想象的几乎任何东西都变得更快、更容易且更具成本效益。

AWS 的这些服务还具有最为多样复杂的功能。例如，AWS 提供了种类繁多的数据库，这些数据库是为不同类型的应用程序专门构建的，因此您可以选择适合作业的工具来获得最佳的成本和性能。

最大的客户和合作伙伴社区
AWS 拥有最大且最具活力的社区，在全球拥有数百万活跃客户和成千上万个合作伙伴。几乎所有行业和规模的客户（包括初创公司、企业和公共部门组织）都在 AWS 上运行所有可能的使用案例。AWS 合作伙伴网络 (APN) 包括专注于 AWS 服务的数千个系统集成商和成千上万个将其技术应用到 AWS 中的独立软件供应商 (ISV)。

最安全
AWS 旨在成为当今市场上最灵活、最安全的云计算环境。我们的核心基础设施是为了满足军事、全球的银行和其他高度敏感性组织的安全要求而构建。一组深度云安全工具对此提供支持，其中包括超过 300 项安全、合规性和监管服务及功能，以及对 143 项安全标准和合规性认证的支持。

最快的创新速度
借助 AWS，您可以利用最新技术更快地进行实验和创新。我们将不断加快创新步伐，以发明您可用于转变业务的全新技术。例如，在 2014 年，AWS 通过推出 AWS Lambda 在无服务器计算领域开创了先河，该平台使开发人员无需预置或管理服务器即可运行其代码。AWS 构建了 Amazon SageMaker，这是一种完全托管的机器学习服务，可让日常开发人员和科学家无需任何前置经验即可运用机器学习。

最成熟的运营专业能力
AWS 具有无与伦比的经验、成熟度、可靠性、安全性和性能，您可以将其用于最重要的应用程序。在超过 17 年的时间中，AWS 一直在为运行各种使用案例的全球数百万客户提供云服务。在所有云服务提供商中，AWS 拥有最丰富的大规模运营经验。

AWS 区域的全球网络
AWS 拥有覆盖范围领先的全球云基础设施。Gartner 已将 AWS 区域/可用区模型
视为一种值得推荐运行方式，适用于要求高可用性的企业应用程序。

最可能同场景使用的其他API

手写文字识别通用API

【更新时间：2024.06.18】手写文字识别，可检测识别图片中的手写中文以及手写数字。其针对不规则手写字体专门进行了优化，有着出色的表现，识别准确率能够达到 90%以上，能精准地对手写文字进行分析和识别，为相关需求提供高效可靠的服务。

智能识别 > 图文识别

578

图像色彩增强通用API

【更新时间：2024.06.18】图像色彩增强，能够智能化地对图片的色彩饱和度、亮度以及对比度进行调节。通过该处理，可让图片的内容细节得以更好呈现，色彩也会更加逼真生动，从而显著提升图片的整体质量和视觉效果。

开发者工具 > 图像工具

118

情感倾向分析通用API 免费