古籍OCR识别-古籍酷

古籍OCR识别-古籍酷

专用API
【更新时间: 2024.08.06】 古籍OCR识别-古籍酷利用光学字符识别(OCR)技术,将古籍中的手写、印刷或雕刻的文字自动转换为可编辑、可搜索的数字文本。这一工具在古籍保护、学术研究、文化传承等领域具有广泛应用价值,能够大大提升古籍资料的利用效率。
服务星级:2星
⭐ ⭐ 🌟 🌟 🌟 🌟 🌟
调用次数
0
集成人数
0
商用人数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是古籍酷的古籍OCR识别?

"古籍OCR识别【古籍酷】"是一款专门用于识别、转换和数字化中文古籍内容的软件或平台。它利用光学字符识别(OCR)技术,将古籍中的手写、印刷或雕刻的文字自动转换为可编辑、可搜索的数字文本。这一工具在古籍保护、学术研究、文化传承等领域具有广泛应用价值,能够大大提升古籍资料的利用效率。

什么是古籍酷的古籍OCR识别?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用古籍酷的古籍OCR识别,从而实现程序的自动化交互,提高服务效率。

古籍酷的古籍OCR识别有哪些核心功能?

1、版面分析:解决了古籍双行夹注的定位与识别。兼容竖排横排,实现了中文OCR的古今通用。

2、文字校正:字识别与列识别融合。通过外部语言模型弥补了原模型在语料覆盖面上的短板。

3、版面提取:针对拼版、表格等特殊版式,分离提取子版面。

4、双层PDF:利用在线工具,可以对识别结果进行编辑修正,生成双层PDF。

古籍酷的古籍OCR识别的核心优势是什么?

  1. 高准确率:特别是工业版,识别准确率可达98.5%左右,确保了古籍内容的准确转换。
  2. 全面功能:集成了OCR识别、自动标点和文言文翻译三大核心功能,为用户提供了一站式的古籍数字化解决方案。
  3. 大规模语料库:文言文翻译功能基于数百万句平行语料库,确保了翻译的准确性和多样性。
  4. 多版本选择:满足不同用户群体的需求,无论是学术研究还是商业应用,都能找到合适的版本。
  5. 易用性:界面友好,操作简便,即使是非专业用户也能轻松上手。

在哪些场景会用到古籍酷的古籍OCR识别?

  1. 图书馆和档案馆:用于大规模古籍的数字化项目,提高古籍的存储、检索和利用效率
  2. 学术研究:历史、文学、哲学等领域的学者可以利用该API进行古籍资料的收集、整理和分析。
  3. 文化传承与教育:博物馆、文化馆等机构可以利用该API制作古籍数字化展品,供公众学习和欣赏。
  4. 出版业:出版社在编辑、出版古籍类图书时,可以利用该API进行原文的识别和校对
<
使用指南
>

1、首先访问ocr_login(授权),获取access_token和refresh_token。

2、然后凭借尚未过期的access_token访问自动识别、自动标点、文白翻译等服务。

3、如果access_token过期,则凭借尚未过期的refresh_token访问ocr_refresh(刷新),获取新的access_token。

4、如果refresh_token过期,则根据方式1,获取新的refresh_token。

 

指南详情链接:https://ocr.gj.cool/readme

<
关于我们
>
中文古籍OCR学术版源自北京市海淀区龙泉寺藏经办公室与深度学习与视觉计算实验室的学术性合作。工作起步于2017年,初始训练数据为前者提供的汉文大藏经的高清图片,双方共同完成数据标注,后者负责模型的设计与训练。 历经若干次数据扩充和模型升级,这里发布的版本完成于2020年,包含三项基础功能:单字识别,单列识别,检测。
联系信息
服务时间: 0:00 - 24:00
邮箱: jizhida@jzd.cool
<
最可能同场景使用的其他API
>
API接口列表
<
使用指南
>

1、首先访问ocr_login(授权),获取access_token和refresh_token。

2、然后凭借尚未过期的access_token访问自动识别、自动标点、文白翻译等服务。

3、如果access_token过期,则凭借尚未过期的refresh_token访问ocr_refresh(刷新),获取新的access_token。

4、如果refresh_token过期,则根据方式1,获取新的refresh_token。

 

指南详情链接:https://ocr.gj.cool/readme

<
依赖服务
>
<
关于我们
>
中文古籍OCR学术版源自北京市海淀区龙泉寺藏经办公室与深度学习与视觉计算实验室的学术性合作。工作起步于2017年,初始训练数据为前者提供的汉文大藏经的高清图片,双方共同完成数据标注,后者负责模型的设计与训练。 历经若干次数据扩充和模型升级,这里发布的版本完成于2020年,包含三项基础功能:单字识别,单列识别,检测。
联系信息
服务时间: 0:00 - 24:00
邮箱: jizhida@jzd.cool
<
最可能同场景使用的其他API
>