图片翻译-百度

图片翻译-百度

专用API
【更新时间: 2023.12.25】 图片文字识别+翻译:集成图片文字识别与文本翻译,支持语种自动检测 实景回填:支持实景回填,返回图片结果
服务星级:6星
⭐ ⭐ ⭐ ⭐ ⭐ ⭐ 🌟
调用次数
0
集成人数
0
商用人数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是百度的图片翻译?

图片翻译API结合OCR及机器翻译技术,可以对图片中的文本内容进行文字识别、语种自动检测并翻译成目标语言,支持译文实景回填。基于业界领先的深度学习技术及翻译技术,提供多场景、多语种、高精度的整图识别+翻译服务。您只需传入图片,即可识别图片中的文字并进行翻译。

什么是百度的图片翻译?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用百度的图片翻译,从而实现程序的自动化交互,提高服务效率。

百度的图片翻译有哪些核心功能?

  1. 图片文字识别+翻译:集成图片文字识别与文本翻译,支持语种自动检测
  2. 实景回填:支持实景回填,返回图片结果

百度的图片翻译的核心优势是什么?

  1. 技术领先:依托百度先进的文字识别及机器翻译技术,满足多场景下图片翻译需求
  2. 接入方便:支持跨平台API调用,避免繁琐的二次接入

在哪些场景会用到百度的图片翻译?

出国旅游:出国旅游时,面对不认识的菜单、路标、广告牌等,

拍照立现翻译结果,语言从此不再是障碍。

学习办公:在外语学习、科研讲座、浏览文档和网页等场景,

拍照或截图快速完成图片翻译,提高学习和工作效率。

<
使用指南
>

相关文档请查看链接https://ai.baidu.com/ai-doc/MT/mki483xpu

<
产品问答
>
?
需要使用什么账号登录?
您需要拥有一个百度账号,用来登录百度云,可以点击此处注册百度账户。如您以前拥有百度推广账户,同样可以登录百度云。
?
注册百度账户时收不到验证码怎么办?
由于欠费停机、存储信息已满、信号网络延迟等原因没有及时收到验证码,这时请检查您的手机及话费余额,保证手机可正常接收短信后,请尝试重新获取验证码。
?
每个服务的请求配额都是免费的么?
目前我们为每个账户下的每项API服务,都设置了固定的免费请求配额,便于您体验服务及应用调试。在免费试用阶段,成功调用或失败调用都算做一次有效调用,会消耗免费测试资源。
?
每个服务的请求配额有限制么?
目前在同一账号下,您可以在对应服务的控制台中查看。付费服务不限请求数量,即用即扣。
?
QPS超限怎么办?
QPS超限可以根据您的需求,进行购买。百度AI技术服务的详细价目表: https://ai.baidu.com/ai-doc/REFERENCE/hk3dwjfzo 价目表包含:免费测试资源、计费简介、计费价目表、费用列举等。
?
支持哪些语言的服务端SDK?
目前支持各项服务的Java、PHP、Python、C#、Node.js版本服务端SDK,部分技术推出了C++、IOS、Android等版本服务端SDK,详情请参见各技术服务SDK文档。
?
什么是base64编码,如何提供?
图片的base64编码指将一副图片数据编码成一串字符串,使用该字符串代替图像地址。您可以首先得到图片的二进制,然后用Base64格式编码即可。注:图片的base64编码是不包含图片头的,(data:image/jpg;base64,)。
?
识别的图片格式有什么要求?
支持PNG、JPG、JPEG、BMP等格式图片,暂不支持 GIF 类型的动图识别。
?
文字识别的并发量上限是多少?
大部分文字识别接口在未开通付费时提供2QPS额度,开通付费后提升至10QPS,如果您有更高并发需求,可购买QPS叠加包进行扩充。对于已上线但没有价格的产品,暂属于测试状态,当测试额度不足时,您可以提交工单进行申请,您需要在工单提供您的appid、业务场景描述、需要的接口名称和申请的并发量。
?
如何购买/提升调用次数?
已上线计费的接口,您可以直接在控制台购买次数包或开通按量后付费,计费价格参见产品价格;未上线计费的接口,您可以提交工单进行申请,您需要在工单提供您的appid、业务场景描述、需要的接口名称和申请的调用次数。
?
文字识别对上传的图片格式、图片大小有哪些要求?
支持 JPG、JPEG、PNG、BMP、TIF、WebP 等格式图片,暂不支持 GIF 类型的动图识别。 一般情况下,图像base64编码后大小必须小于4M,建议不要超过1M;最小边长不小于15,最大边长不超过4096,建议不要超过1024(编码后大于1M或最大边长超过1024的图像会被等比压缩,建议控制输入图像大小,有助于减少网络传输及接口处理耗时)。但是不同的功能接口,对于图片大小的要求可能不同,具体以相应的API文档中的 Image 和 url 参数说明为准。
?
怎么提高识别的准确率和识别速度?
文字识别的准确率跟拍摄光照、背景、清晰度等因素有关。推荐上传JPG图片格式,图片大小建议1M以内。可在图片采集端尽量扩大要识别文字的区域,并保证图片内文字清晰人眼可辨认、倾斜度不得小于30%。同时,适当压缩图片大小,可大幅缩短图片识别时间。
?
文字识别支持的语言?
不同的功能接口,所支持的语言都不同。常见多语言识别接口如下: 通用文字识别(标准版)、通用文字识别(标准含位置版):支持中文简体、中文繁体、英文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语。 通用文字识别(高精度版)、通用文字识别(高精度含位置版):支持中文简体、中文繁体、英文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语。 其他接口(除国内专用卡证票据外)基本均可支持中、英文内容识别。详细参见API文档。 如果您对于产品支持识别的语言有特殊需求,您可以提交工单联系我们。
?
文字识别是否支持方向旋转/不同朝向的图片文字识别?
文字识别大部分能力均已支持图像方向自动校正功能,可对旋转的图片进行正确的识别,也可通过控制参数『detect_direction』为true/false控制该功能是否开启。如果您在使用中存在部分旋转图片无法正确识别的问题,您可以提交工单告知我们进行优化。
?
图片格式和分辨率有限制吗?
目前图片格式支持PNG、JPG、JPEG、BMP、GIF(仅对首帧进行审核)、Webp、TIFF;图像要求base64后大于等于5KB,小于等于4MB,最短边大于等于128像素,小于等于4096像素。
?
图片大小有限制吗?
图像URL地址,以URL形式请求,图像Url需要做UrlEncode,图像要求base64后大于等于5kb, 小于等于4M,最短边大于等于128像素,小于等于4096像素。
?
识别的图片支持怎样输入?
支持传输Base64编码后的图片或者图片的URL。
?
什么是base64编码,如何提供?
图片的base64编码指将一副图片数据编码成一串字符串,使用该字符串代替图像地址。您可以首先得到图片的二进制,然后用Base64格式编码即可。注:图片的base64编码是不包含图片头的,如(data:image/jpg;base64,)。
?
是否支持通过URL方式传入图片?
支持。您可以通过图像审核组合服务接口,使用该服务。
?
图像识别接口可以识别哪些图像?
图像识别接口可支持通用物体和场景识别、品牌logo识别、动物识别、植物识别、菜品识别、地标识别、果蔬识别、红酒识别、货币识别、图像主体识别、翻拍识别、快消商品检测等。详情链接:https://ai.baidu.com/tech/imagerecognition
<
关于我们
>
北京百度网讯科技有限公司,是百度旗下公司,拥有网页搜索、hao123、百度推广等多条业务线。百度将“让人们最平等、便捷地获取信息,找到所求”作为自己的使命,致力于为用户提供“简单可依赖”的互联网搜索产品及服务。百度是全球最大的中文搜索引擎、最大的中文网站,2000年1月创立于北京中关村。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于2000年1月1日在中关村创建了百度公司。从最初的不足10人发展至今,员工人数超过18000人。如今的百度,已成为中国最受欢迎、影响力最大的中文网站。百度拥有数千名研发工程师,这是中国乃至全球最为优秀的技术团队,这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。
联系信息

百度地图凭借其卓越的产品服务、深入的行业耕耘、尖端的专业技术以及开放的平台生态,为政企开发者提供坚实可靠的地图数字底座。

 

<
最可能同场景使用的其他API
>
API接口列表
<
使用指南
>

相关文档请查看链接https://ai.baidu.com/ai-doc/MT/mki483xpu

<
依赖服务
>
<
产品问答
>
?
需要使用什么账号登录?
您需要拥有一个百度账号,用来登录百度云,可以点击此处注册百度账户。如您以前拥有百度推广账户,同样可以登录百度云。
?
注册百度账户时收不到验证码怎么办?
由于欠费停机、存储信息已满、信号网络延迟等原因没有及时收到验证码,这时请检查您的手机及话费余额,保证手机可正常接收短信后,请尝试重新获取验证码。
?
每个服务的请求配额都是免费的么?
目前我们为每个账户下的每项API服务,都设置了固定的免费请求配额,便于您体验服务及应用调试。在免费试用阶段,成功调用或失败调用都算做一次有效调用,会消耗免费测试资源。
?
每个服务的请求配额有限制么?
目前在同一账号下,您可以在对应服务的控制台中查看。付费服务不限请求数量,即用即扣。
?
QPS超限怎么办?
QPS超限可以根据您的需求,进行购买。百度AI技术服务的详细价目表: https://ai.baidu.com/ai-doc/REFERENCE/hk3dwjfzo 价目表包含:免费测试资源、计费简介、计费价目表、费用列举等。
?
支持哪些语言的服务端SDK?
目前支持各项服务的Java、PHP、Python、C#、Node.js版本服务端SDK,部分技术推出了C++、IOS、Android等版本服务端SDK,详情请参见各技术服务SDK文档。
?
什么是base64编码,如何提供?
图片的base64编码指将一副图片数据编码成一串字符串,使用该字符串代替图像地址。您可以首先得到图片的二进制,然后用Base64格式编码即可。注:图片的base64编码是不包含图片头的,(data:image/jpg;base64,)。
?
识别的图片格式有什么要求?
支持PNG、JPG、JPEG、BMP等格式图片,暂不支持 GIF 类型的动图识别。
?
文字识别的并发量上限是多少?
大部分文字识别接口在未开通付费时提供2QPS额度,开通付费后提升至10QPS,如果您有更高并发需求,可购买QPS叠加包进行扩充。对于已上线但没有价格的产品,暂属于测试状态,当测试额度不足时,您可以提交工单进行申请,您需要在工单提供您的appid、业务场景描述、需要的接口名称和申请的并发量。
?
如何购买/提升调用次数?
已上线计费的接口,您可以直接在控制台购买次数包或开通按量后付费,计费价格参见产品价格;未上线计费的接口,您可以提交工单进行申请,您需要在工单提供您的appid、业务场景描述、需要的接口名称和申请的调用次数。
?
文字识别对上传的图片格式、图片大小有哪些要求?
支持 JPG、JPEG、PNG、BMP、TIF、WebP 等格式图片,暂不支持 GIF 类型的动图识别。 一般情况下,图像base64编码后大小必须小于4M,建议不要超过1M;最小边长不小于15,最大边长不超过4096,建议不要超过1024(编码后大于1M或最大边长超过1024的图像会被等比压缩,建议控制输入图像大小,有助于减少网络传输及接口处理耗时)。但是不同的功能接口,对于图片大小的要求可能不同,具体以相应的API文档中的 Image 和 url 参数说明为准。
?
怎么提高识别的准确率和识别速度?
文字识别的准确率跟拍摄光照、背景、清晰度等因素有关。推荐上传JPG图片格式,图片大小建议1M以内。可在图片采集端尽量扩大要识别文字的区域,并保证图片内文字清晰人眼可辨认、倾斜度不得小于30%。同时,适当压缩图片大小,可大幅缩短图片识别时间。
?
文字识别支持的语言?
不同的功能接口,所支持的语言都不同。常见多语言识别接口如下: 通用文字识别(标准版)、通用文字识别(标准含位置版):支持中文简体、中文繁体、英文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语。 通用文字识别(高精度版)、通用文字识别(高精度含位置版):支持中文简体、中文繁体、英文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语。 其他接口(除国内专用卡证票据外)基本均可支持中、英文内容识别。详细参见API文档。 如果您对于产品支持识别的语言有特殊需求,您可以提交工单联系我们。
?
文字识别是否支持方向旋转/不同朝向的图片文字识别?
文字识别大部分能力均已支持图像方向自动校正功能,可对旋转的图片进行正确的识别,也可通过控制参数『detect_direction』为true/false控制该功能是否开启。如果您在使用中存在部分旋转图片无法正确识别的问题,您可以提交工单告知我们进行优化。
?
图片格式和分辨率有限制吗?
目前图片格式支持PNG、JPG、JPEG、BMP、GIF(仅对首帧进行审核)、Webp、TIFF;图像要求base64后大于等于5KB,小于等于4MB,最短边大于等于128像素,小于等于4096像素。
?
图片大小有限制吗?
图像URL地址,以URL形式请求,图像Url需要做UrlEncode,图像要求base64后大于等于5kb, 小于等于4M,最短边大于等于128像素,小于等于4096像素。
?
识别的图片支持怎样输入?
支持传输Base64编码后的图片或者图片的URL。
?
什么是base64编码,如何提供?
图片的base64编码指将一副图片数据编码成一串字符串,使用该字符串代替图像地址。您可以首先得到图片的二进制,然后用Base64格式编码即可。注:图片的base64编码是不包含图片头的,如(data:image/jpg;base64,)。
?
是否支持通过URL方式传入图片?
支持。您可以通过图像审核组合服务接口,使用该服务。
?
图像识别接口可以识别哪些图像?
图像识别接口可支持通用物体和场景识别、品牌logo识别、动物识别、植物识别、菜品识别、地标识别、果蔬识别、红酒识别、货币识别、图像主体识别、翻拍识别、快消商品检测等。详情链接:https://ai.baidu.com/tech/imagerecognition
<
关于我们
>
北京百度网讯科技有限公司,是百度旗下公司,拥有网页搜索、hao123、百度推广等多条业务线。百度将“让人们最平等、便捷地获取信息,找到所求”作为自己的使命,致力于为用户提供“简单可依赖”的互联网搜索产品及服务。百度是全球最大的中文搜索引擎、最大的中文网站,2000年1月创立于北京中关村。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于2000年1月1日在中关村创建了百度公司。从最初的不足10人发展至今,员工人数超过18000人。如今的百度,已成为中国最受欢迎、影响力最大的中文网站。百度拥有数千名研发工程师,这是中国乃至全球最为优秀的技术团队,这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。
联系信息

百度地图凭借其卓越的产品服务、深入的行业耕耘、尖端的专业技术以及开放的平台生态,为政企开发者提供坚实可靠的地图数字底座。

 

<
合作案例
>

<
最可能同场景使用的其他API
>