小语种OCR识别-阿里云市场

小语种OCR识别-阿里云市场

专用API
【更新时间: 2024.08.02】 阿里云小语种OCR识别API能够支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息。语言检测覆盖十余个国家地区语种,适用于国际化所需的各类图文识别与信息翻译场景。
免费 (200次/月) 去服务商官网采购>
服务星级:2星
⭐ ⭐ 🌟 🌟 🌟 🌟 🌟
调用次数
0
集成人数
0
商用人数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是阿里云市场的小语种OCR识别?

阿里云小语种文字识别服务是一种基于阿里云计算平台的OCR解决方案,旨在处理和识别多种小语种文本。该服务通过先进的机器学习和人工智能技术,对图片、扫描件和手写文本等进行高精度的文字识别。其核心技术包括图像预处理、文字检测、字符识别和语言模型优化,使其在处理复杂背景、模糊字符和不规则排版时仍能保持高准确率。用户只需将包含小语种文本的图片上传到阿里云平台,即可快速获得文本内容,为多语言业务运营提供了便捷的支持。

什么是阿里云市场的小语种OCR识别?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用阿里云市场的小语种OCR识别,从而实现程序的自动化交互,提高服务效率。

阿里云市场的小语种OCR识别有哪些核心功能?

通用多语言识别

读光通用多语言识别能够支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息。语言检测覆盖十余个国家地区语种,适用于国际化所需的各类图文识别与信息翻译场景。

英语专项识别

读光OCR英文专项识别是针对全英文图片文档场景下英文印刷体字符高效检测和识别的原子能力产品,具备英文专项识别和英文分词功能,支持旋转、表格、文字坐标等多项基础功能,全英文文档字符识别率超过99%。

 

日语识别

读光OCR日语识别是针对全日文图片文档场景下日文印刷体高效检测和识别的原子能力产品,支持旋转、表格、文字坐标等多项基础功能。

俄语识别

读光OCR俄语识别是针对图片文档场景下俄文印刷体高效检测和识别的原子能力产品,支持旋转、表格、文字坐标等多项基础功能。

韩语识别

读光OCR韩语识别是针对图片文档场景下韩文印刷体高效检测和识别的原子能力产品,支持旋转、表格、文字坐标等多项基础功能。

泰语识别

读光OCR泰语识别是针对泰语图片文档场景下泰文印刷体高效检测和识别的原子能力产品,支持旋转、表格、文字坐标等多项基础功能。

拉丁语识别

读光OCR拉丁语识别是针对拉丁语系的图片文档场景下印刷体高效检测和识别的原子能力产品,支持旋转、表格、文字坐标等多项基础功能。可识别英语,德语,西班牙,法语,意大利语,葡萄牙语,马来西亚语,印尼语,土耳其语,越南语等语种。

 

阿里云市场的小语种OCR识别的核心优势是什么?

准确率高
利用海量的图片样本训练模型,具有超高的准确率 

实时性高
依托于阿里自建的EAS在线服务集群,提供弹性伸缩的低延时服务

技术前沿精深
基于阿里云机器学习平台PAI,训练出的文本检测及识别模型

服务稳定
提供弹性服务,扩展性好,算法持续的迭代优化对用户稳定性无影响

       

在哪些场景会用到阿里云市场的小语种OCR识别?

信息翻译
信息翻译场景下需要支持覆盖多个语系,读光OCR支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息

能够解决
适用于国际化所需的各类图文识别与信息翻译场景;语言检测覆盖十余个国家地区语种

 

商务公关
商务公关场景下需要多语言以及精准快速翻译响应,读光OCR支持国际主流几大语系的自动语言分类判定并及时返回对应语言的文字信息,语言检测覆盖十余个国家地区语种

能够解决
方便商务人员处理多语言场景

教育领域

小语种识别服务在教育领域发挥着重要作用。它辅助语言学习者更好地理解和掌握小语种,提供实时的翻译和解释,帮助学生克服语言障碍,提高学习效率。

 

旅游行业

随着旅游市场的多元化发展,小语种识别服务在旅游行业中变得越来越重要。我们的服务能够提供详尽的多语言旅游信息和指南,包括目的地介绍、文化习俗、旅行小贴士等,满足不同语言背景游客的需求。

<
产品价格
>

产品规格-后付费按次调用

产品规格-预付费资源包

 

<
使用指南
>

案例:

通用多语言识别

接口说明

本接口适用场景

  • 阿里云通用多语言证识别,是阿里云官方自研 OCR 文字识别产品,适用于国际化所需的各类图文识别与信息翻译场景。
  • 阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作简易、实时性高、能力全面等几大优势。

本接口核心能力

分类 概述
图像增强 默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。
多类型覆盖 支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。
高精度识别 总体识别准确率可达 98%。

如何使用本接口

步骤 概述
1

开通 通用文字识别 服务。开通服务前后,您可以通过体验馆免费体验本功能识别效果。

 

2 购买小语种识别资源包。本 API 会赠送免费额度,可使用免费额度测试。
3 可以参照调试页面提供的代码示例完成 API 接入开发。接入完成后,调用 API 获取识别结果。如果使用子账号调用接口,需要阿里云账号(主账号)对 RAM 账号进行授权。创建 RAM 用户的具体操作,请参考:创建 RAM 用户。文字识别服务提供一种系统授权策略,即 AliyunOCRFullAccess。具体授权操作,请参见在用户页面为 RAM 用户授权。

重要提示

类型 概述
类型 概述
图片格式
  • 本接口支持:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式。
图片尺寸
  • 图片长宽需要大于 15 像素,小于 8192 像素。
  • 长宽比需要小于 50。
  • 如需达到较好识别效果,建议长宽均大于 500px。
  • 图片尺寸过小,会影响识别精度。图片内单字大小在 10-50px 内时,识别效果较好。
图片大小
  • 图片二进制文件不能超过 10MB。
  • 图片过大会影响接口响应速度,建议使用小于 1.5M 图片进行识别,且通过传图片 URL 的方式调用接口。
其他提示
  • 接口响应速度和图片中的文字数量有关,如果图片中文字数量越多,接口响应可能越慢。
  • 接口会自动处理反光、扭曲等干扰信息,但会影响精度。请尽量选择清晰度高、无反光、无扭曲的图片。
相关能力

示例

正常返回示例

 
 
{
  "RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
  "Data": "{\"content\":\"PACKING  Shipper/Export   Invoice No & Date  STM TECHNOLOGY INC. 20140730- ST44 \",\"height\":1753,\"orgHeight\":1753,\"orgWidth\":1240,\"prism_version\":\"1.0.9\",\"prism_wnum\":71,\"prism_wordsInfo\":[{\"angle\":0,\"direction\":0,\"height\":33,\"pos\":[{\"x\":348,\"y\":137},{\"x\":531,\"y\":135},{\"x\":532,\"y\":168},{\"x\":348,\"y\":170}],\"prob\":99,\"recClassify\":1,\"width\":184,\"word\":\"PACKING\",\"x\":348,\"y\":135}],\"width\":1240}",
  "Code": "200",
  "Message": "message"
}

详情参考:https://help.aliyun.com/zh/ocr/developer-reference/api-ocr-api-2021-07-07-overview?spm=a2c4g.11186623.0.0.56ef139bT0vzZP#api-overview-94306-1

 

<
关于我们
>
丰富的企业应用,满足企业经营和数字化所需 安全合规 亚太合规资质最全的云服务商之一,从基础设施安全、内核平台安全、系统服务安全、云安全产品四个层面,保障千行百业客户的业务安全在线。拥有权威认可的原生安全能力,根据2021年Gartner报告,安全能力全球第一。 技术领先 飞天是阿里云自主研发、国内唯一自研的云计算操作系统,编排调度百万级服务器,单集群调度规模超十万台,具备EB级数据存储能力,并通过CIPU率先实现虚拟化“0”损耗,提供业界领先的计算性能,既满足客户严苛的业务要求,又提供高性价比服务。
联系信息
服务时间: 7*24
电话号码: 4008013260

<
最可能同场景使用的其他API
>
API接口列表
<
产品价格
>

产品规格-后付费按次调用

产品规格-预付费资源包

 

<
使用指南
>

案例:

通用多语言识别

接口说明

本接口适用场景

  • 阿里云通用多语言证识别,是阿里云官方自研 OCR 文字识别产品,适用于国际化所需的各类图文识别与信息翻译场景。
  • 阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作简易、实时性高、能力全面等几大优势。

本接口核心能力

分类 概述
图像增强 默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。
多类型覆盖 支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。
高精度识别 总体识别准确率可达 98%。

如何使用本接口

步骤 概述
1

开通 通用文字识别 服务。开通服务前后,您可以通过体验馆免费体验本功能识别效果。

 

2 购买小语种识别资源包。本 API 会赠送免费额度,可使用免费额度测试。
3 可以参照调试页面提供的代码示例完成 API 接入开发。接入完成后,调用 API 获取识别结果。如果使用子账号调用接口,需要阿里云账号(主账号)对 RAM 账号进行授权。创建 RAM 用户的具体操作,请参考:创建 RAM 用户。文字识别服务提供一种系统授权策略,即 AliyunOCRFullAccess。具体授权操作,请参见在用户页面为 RAM 用户授权。

重要提示

类型 概述
类型 概述
图片格式
  • 本接口支持:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式。
图片尺寸
  • 图片长宽需要大于 15 像素,小于 8192 像素。
  • 长宽比需要小于 50。
  • 如需达到较好识别效果,建议长宽均大于 500px。
  • 图片尺寸过小,会影响识别精度。图片内单字大小在 10-50px 内时,识别效果较好。
图片大小
  • 图片二进制文件不能超过 10MB。
  • 图片过大会影响接口响应速度,建议使用小于 1.5M 图片进行识别,且通过传图片 URL 的方式调用接口。
其他提示
  • 接口响应速度和图片中的文字数量有关,如果图片中文字数量越多,接口响应可能越慢。
  • 接口会自动处理反光、扭曲等干扰信息,但会影响精度。请尽量选择清晰度高、无反光、无扭曲的图片。
相关能力

示例

正常返回示例

 
 
{
  "RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
  "Data": "{\"content\":\"PACKING  Shipper/Export   Invoice No & Date  STM TECHNOLOGY INC. 20140730- ST44 \",\"height\":1753,\"orgHeight\":1753,\"orgWidth\":1240,\"prism_version\":\"1.0.9\",\"prism_wnum\":71,\"prism_wordsInfo\":[{\"angle\":0,\"direction\":0,\"height\":33,\"pos\":[{\"x\":348,\"y\":137},{\"x\":531,\"y\":135},{\"x\":532,\"y\":168},{\"x\":348,\"y\":170}],\"prob\":99,\"recClassify\":1,\"width\":184,\"word\":\"PACKING\",\"x\":348,\"y\":135}],\"width\":1240}",
  "Code": "200",
  "Message": "message"
}

详情参考:https://help.aliyun.com/zh/ocr/developer-reference/api-ocr-api-2021-07-07-overview?spm=a2c4g.11186623.0.0.56ef139bT0vzZP#api-overview-94306-1

 

<
依赖服务
>
<
关于我们
>
丰富的企业应用,满足企业经营和数字化所需 安全合规 亚太合规资质最全的云服务商之一,从基础设施安全、内核平台安全、系统服务安全、云安全产品四个层面,保障千行百业客户的业务安全在线。拥有权威认可的原生安全能力,根据2021年Gartner报告,安全能力全球第一。 技术领先 飞天是阿里云自主研发、国内唯一自研的云计算操作系统,编排调度百万级服务器,单集群调度规模超十万台,具备EB级数据存储能力,并通过CIPU率先实现虚拟化“0”损耗,提供业界领先的计算性能,既满足客户严苛的业务要求,又提供高性价比服务。
联系信息
服务时间: 7*24
电话号码: 4008013260

<
最可能同场景使用的其他API
>