API知识库 > API探索 > 身份验证技术,高效而统一的API服务:(3)OCR识别
身份验证技术,高效而统一的API服务:(3)OCR识别

身份验证技术,高效而统一的API服务:(3)OCR识别

OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。它作为身份验证过程中一项辅助性的工具,常常被用于证照的图片信息提取阶段,是进行数据验证比对的先决条件。

OCR验证技术融合了计算机视觉、深度学习、自然语言处理等多项AI技术,可以高效提取图像中的信息,而幂简产品的宗旨就是将这项技术统一成集中式的API组件库,严格遵照国家档案局发布的《纸质档案数字复制件光学字符识别(OCR)工作规范》相关标准,为企业提供完备高效的OCR服务。

通过幂简平台产品,用户可以通过OCR识别模块中各种各样的API服务部署,基于双引擎识别智能模型,有效识别验真各类卡证,同时通过安全技术服务辨别卡证原件的真实性和有效性。

幂简OCR识别API服务集成了市场主流供应商,应用标准化、多维度OCR识别服务,从安全、信息完整性等方面做了增强,充分保障各类卡证都能被精准识别。它包含了常用卡证中所涉及到的多种信息要件,包括身份证、银行卡、营业执照、增值税发票、开户许可证等,实现快速、高效、准确识别。

目前,OCR识别API已实现多种多样的功能与场景落地。例如,其可用于个人资质采集,借助卡证OCR识别,使用身份证、银行卡等OCR技术,用于政务、银行、金融、O20、交通出行等应用下的远程用户身份认证;再如,在企业级场景下,使用开户许可证、营业执照识别等OCR技术,可实现电商、外卖、运输服务等场景下的商户身份认证、资质文件审核;此外,其还可用于纸质文档数字化,支持企业、银行、个人等多种支票、商业承兑汇票以及进账单等金融票据的整单识别,代替人工录入,提升处理效率。

在具体技术层面,个人验证API服务分为如下几个模块。

1.身份证OCR

定义:身份证OCR识别用于识别身份证正反面文字信息,通过比对姓名和身份证号,实时联网核查核验是否一致并返回结果。

优势:

  • 支持对URL网络图片和Base64信息进行识别。
  • 支持PNG、JPG、JPEG格式,双引擎识别,无需重复多次对接。
  • 识别成功时同步返回JSON格式的响应文件,便于数据分析、风险控制;识别失败时精准返回错误信息及错误代码,快速定位问题。
  • 多机房集群部署、支持高并发,多通道备用切换。
  • 支持多角度、多光线识别,智能识别准确率高。
  • 身份证归属地实施动态维护,确保兼容新旧身份证信息,确保信息准确。

场景:

安全提示:

  • 收集用户身份信息,需要获取用户授权,并保留相关授权痕迹。
  • 用户身份信息要加密存储,确保不被泄露。
  • 日志系统不应存储用户身份信息。
  • 校验信息采用官方渠道,信息传输多重加密,零缓存。
  • 增值安全技术服务,识别是否翻拍、复印件并返回结果。
  • 应用系统展示用户信息时,要脱敏,例如:110******17。

2.银行卡OCR

定义:银行卡OCR识别用于识别银行卡正面信息,包含银行卡号、银行卡类型、银行名称、银行代码等信息, 识别是否翻拍,是否复印件并返回结果。

优势:

  • 识别成功时同步返回JSON格式的响应文件,便于数据分析、风险控制;识别失败时精准返回错误信息及错误代码,快速定位问题。
  • 支持对URL网络图片和Base64信息进行识别。
  • 支持PNG、JPG、JPEG格式,双引擎识别,无需重复多次对接。
  • 多机房集群部署、支持高并发,多通道备用切换。
  • 支持多角度、多光线识别,智能识别准确率高。
  • 该项认证服务覆盖全国所有银联卡,系统数据实现实时更新,新开户销户及信息更改用户随时维护进入数据库。

场景:

安全提示:

  • 收集银行卡信息,需要获取相关用户授权,并保留相关授权痕迹。
  • 银行卡信息要加密存储,确保不被泄露。
  • 日志系统不应存储银行交易流水等私人信息。
  • 校验信息采用官方渠道,信息传输多重加密,零缓存。
  • 增值安全技术服务,识别是否翻拍、复印件并返回结果。
  • 应用系统展示银行卡信息时,要脱敏,例如:6127************546。

3.营业执照OCR

定义:营业执照OCR识别支持营业执照信息,包含企业名称、统一社会信用编码、企业注册号、法人名称、经营范围等营业执照实体信息。

优势:

  • 识别成功时同步返回JSON格式的响应文件,便于数据分析、风险控制;识别失败时时精准返回错误信息及错误代码,快速定位问题。
  • 支持对URL网络图片和Base64信息进行识别。
  • 支持PNG、JPG、JPEG格式,双引擎识别,无需重复多次对接。
  • 多机房集群部署、支持高并发,多通道备用切换。
  • 支持多角度、多光线识别,智能识别准确率高。
  • 企业营运信息数据库实时更新,直连官方数据库,支持企查查等二次查证。

场景:

安全提示:

  • 收集企业营业执照相关信息,需要获取相关法人代表授权,并保留相关授权痕迹。
  • 相关信息要加密存储,确保不被泄露。
  • 日志系统不应存储企业内部信息等反不正当竞争法保护的私有信息。
  • 校验信息采用官方渠道,信息传输多重加密,零缓存。
  • 增值安全技术服务,识别是否翻拍、复印件并返回结果。
  • 应用系统展示相关企业时,要脱敏。

4.增值税发票OCR

定义:幂简增值税发票OCR识别API是一种利用光学字符识别技术,从增值税发票图像中自动提取发票号码、日期、金额等信息的功能接口。

优势:

  • 该技术可以大幅提升企业的财务处理效率,减少人力成本和错误率,并为税务管理提供数据支持。
  • 认证一致时同步返回JSON格式的响应文件,便于数据分析、风险控制;认证不一致时精准返回错误信息及错误代码,快速定位问题。
  • 支持对URL网络图片和Base64信息进行识别。
  • 支持PNG、JPG、JPEG格式,双引擎识别,无需重复多次对接。
  • 多机房集群部署、支持高并发,多通道备用切换。
  • 支持多角度、多光线识别,智能识别准确率高。

安全提示:

  • 收集相关增值税发票相关信息,需要获取相关商户或法人代表授权,并保留相关授权痕迹。
  • 相关信息要加密存储,确保不被泄露。
  • 日志系统不应存储与交易无关的其他信息。
  • 校验信息采用官方渠道,信息传输多重加密,零缓存。
  • 增值安全技术服务,识别是否翻拍、复印件并返回结果。
  • 应用系统展示相关交易信息时,要脱敏。

5.开户许可证OCR

定义:企业开户许可证OCR识别用于快速精准地识别银行开户许可证中的账号、核准号、企业名称、法人姓名以及开户行等关键信息。

优势:

  • 识别成功时同步返回JSON格式的响应文件,便于数据分析、风险控制;识别失败时时精准返回错误信息及错误代码,快速定位问题。
  • 支持对URL网络图片和Base64信息进行识别。
  • 支持PNG、JPG、JPEG格式,双引擎识别,无需重复多次对接。
  • 多机房集群部署、支持高并发,多通道备用切换。
  • 支持多角度、多光线识别,智能识别准确率高。
  • 银行信息数据库实时更新,直连官方数据库。

场景:

安全提示:

  • 收集客户相关信息,需要获取相关客户授权,并保留相关授权痕迹。
  • 客户信息要加密存储,确保不被泄露。
  • 日志系统不应存储客户私人信息。
  • 校验信息采用官方渠道,信息传输多重加密,零缓存。
  • 增值安全技术服务,识别是否翻拍、复印件并返回结果。
  • 应用系统展示客户信息时,要脱敏。