官方

北京百度网讯科技有限公司

去官网 去官网

百度智能云于2015年正式对外开放运营,以“云智一体”为核心赋能千行百业,致力于为企业和开发者提供全球领先的人工智能、大数据和云计算服务及易用的开发工具。凭借先进的技术和丰富的解决方案,全面赋能各行业,加速产业智能化。

通用API 通用API
实时语音翻译服务
实时语音翻译API提供多语种实时语音转文本和翻译服务,支持智能断句、低延迟高效率的语音识别和翻译。
销量:- 响应时长:- sla:-
Falcon文本生成模型(TII)
Falcon是一个自回归解码器模型。自回归解码器模型指的是模型经过训练,可以在给定前一个标记的情况下预测下一个标记的序列。Falcon 家族有两个基础模型: Falcon-40B 及Falcon-7B。
销量:- 响应时长:- sla:-
Stable-Diffusion图像生成模型
Stable Diffusion是一种基于扩散模型的深度学习技术,主要用于生成高质量图像。擅长根据用户提供的文本提示生成对应内容的图像。
销量:- 响应时长:- sla:-
StarCoder代码生成模型
StarCoder 和 StarCoderBase 是针对代码的大语言模型 (代码 LLM),模型基于 GitHub 上的许可数据训练而得,训练数据中包括 80 多种编程语言、Git 提交、GitHub 问题和 Jupyter notebook。
销量:- 响应时长:- sla:-
SQLCoder代码生成模型(Base StarCoder)
SQLCoder-7B是由Defog研发、基于Mistral-7B微调的语言模型,用于将自然语言问题转换为SQL语句,具备优秀的生成效果。本文介绍了相关API。
销量:- 响应时长:- sla:-
Baichuan文本生成模型
Baichuan 2 是百川智能推出的新一代开源大语言模型,采用2.6万亿Tokens的高质量语料训练,在权威的中文和英文 benchmark 上均取得同尺寸领先的效果。
销量:- 响应时长:- sla:-
Yi-34B文本生成模型
Yi-34B文本生成模型,一款AI工具,利用深度学习提供个性化文本生成服务。适用于写作、文案、技术文档等,提升创作效率,探索新风格。
销量:- 响应时长:- sla:-
Fuyu-8B图像理解模型
Fuyu-8B服务是一款AI图片信息分析工具,适用于图像识别、内容审核等场景。它通过高效算法提供准确图片内容解析,是一个强大、灵活、易集成的解决方案。
销量:- 响应时长:- sla:-
Chinese-LLaMA文本生成模型
中文LLaMA模型,在原版LLaMA的基础上扩充了中文词表并使用了中文数据进行二次预训练,进一步提升了中文基础语义理解能力。针对原版LLaMA模型扩充了中文词表,提升了中文编解码效率
销量:- 响应时长:- sla:-
PostgreSQL
云原生数据库 PostgreSQL 版100%兼容 PostgreSQL,高度兼容Oracle语法。为用户提供快速弹性、高性能、海量存储、安全可靠的数据库服务。
销量:- 响应时长:- sla:-
向量数据库
向量数据库是一款全托管的自研企业级分布式数据库服务,专用于存储、检索、分析多维向量数据。该数据库支持多种索引类型和相似度计算方法,可支持百万级 QPS 及毫秒级查询延迟。
销量:- 响应时长:- sla:-
HBase
云数据库 HBase 版是面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力。
销量:- 响应时长:- sla:-
MySQL
云数据库 MySQL 版基于 MySQL 源码分支,经过高并发、大数据量的考验,拥有优良的性能, 还支持读写分离、SQL、多可用区集群等高级功能。
销量:- 响应时长:- sla:-
MongoDB
云数据库 MongoDB 版是完全兼容 MongoDB 协议、高度兼容 DynamoDB 协议的在线文档型数据库服务。
销量:- 响应时长:- sla:-
增值税发票核验
预集成
增值税发票的信息核验,开票后24小时即可进行查验。可同时对接发票识别能力,完成发票识别的同时进行自动化验真。
销量:- 响应时长:- sla:-
redis
Redis是一种开源、高性能的键值对数据库,以内存存储为主,支持持久化。它提供了丰富的数据结构如字符串、哈希表、列表、集合、有序集合等,并具备发布/订阅、事务、Lua脚本等功能。
销量:- 响应时长:- sla:-
文件存储SMB(CIFS)协议
SMB(Server Message Block)协议,又称为CIFS(Common Internet File System),是一种广泛应用的网络文件共享协议。
销量:- 响应时长:- sla:-
Kafka
Apache Kafka是一种高吞吐量、分布式的消息发布订阅系统,以其强大的实时数据处理和流处理能力而广受业界认可。
销量:- 响应时长:- sla:-
块存储(云硬盘)
块存储服务(通常称为云硬盘)是一种基于云计算环境的高性能、高可靠的数据存储解决方案。它为用户提供可扩展的、类似于物理硬盘的虚拟块存储空间,能够即插即用地挂载到云服务器上,实现数据的高效读写与持久化存储。
销量:- 响应时长:- sla:-
文件存储POSIX协议
POSIX协议是一种操作系统接口标准,旨在确保不同操作系统间的兼容性和互操作性。
销量:- 响应时长:- sla:-
文件存储MPI-IO协议
MPI-IO(Message Passing Interface Input/Output)是一种并行I/O协议,专为高性能计算环境设计,允许MPI进程集合协同进行文件存储操作。
销量:- 响应时长:- sla:-
增值税发票OCR识别
预集成
识别增值税普票、机动车发票、火车票、PDF电子票、行程单等类型发票的基本信息、销售方及购买方信息、商品信息、价税信息等,并转化为文字/数字。
销量:- 响应时长:- sla:-
出生医学证明识别
支持对出生医学证明的23个关键字段进行结构化识别,包括新生儿姓名、性别、出生时间、父亲姓名、母亲姓名、出生证编号等。
销量:- 响应时长:- sla:-
语音翻译
语音翻译API集成语音识别、文本翻译、语音合成技术,将短语音快速识别、翻译为目标语言文本,并支持语音播报。应用广泛,可用于跨语言交流、旅行、教育等场景。
销量:- 响应时长:- sla:-
身份证人像面识别
预集成
身份证人像面OCR识别,支持识别身份证正面文字信息,通过比对姓名和身份证号,实时联网核查核验是否一致并返回结果。支持对URL网络图片和Base64信息进行识别,支持PNG、JPG、JPEG格式,双引擎识别。
销量:- 响应时长:- sla:-
人体检测与属性识别
对于输入的一张图片(可正常解码,且长宽比适宜),检测图像中的所有人体并返回每个人体的位置信息,识别人体的静态属性和行为。
销量:- 响应时长:- sla:-
文档翻译
文档翻译API服务是一项便捷的工具,通过HTTP API提供文档翻译功能。用户可将文档以Base64编码形式传输至服务器,并指定源语言与目标语言,实现即时翻译。
销量:- 响应时长:- sla:-
机动车登记证书识别
机动车登记证书识别服务可以快速准确地提取车辆信息,包括车主、车牌号、登记日期等重要字段。
销量:- 响应时长:- sla:-
图像去雾
通过人工智能算法,实现对浓雾下拍摄,导致细节无法辨认的图像进行去雾处理,还原更清晰真实的图像。
销量:- 响应时长:- sla:-
身份管理服务
身份管理服务API为企业提供了可靠的身份验证和访问控制解决方案。通过统一管理内外部用户身份,实现单点登录、多因素认证等功能,确保数据和资源的安全访问。
销量:- 响应时长:- sla:-
文件存储NFS协议
NFS(Network File System)是一种广泛应用的网络文件系统协议,允许用户通过网络将远程计算机上的磁盘文件共享给本地主机访问。
销量:- 响应时长:- sla:-
驾驶证识别
驾驶证识别是一项基于光学字符识别(OCR)技术的服务,它可以高效准确地从驾驶证的正页和副页图像中抽取并结构化识别各类关键信息。
销量:- 响应时长:- sla:-
音频文件转文字
音频文件转文字API服务利用深度学习技术,将音频中的语音内容自动转换为文字,适用于智能客服质检、会议访谈转写、游戏语音输入、课堂内容分析等场景。
销量:- 响应时长:- sla:-
印章识别
检测并识别合同文件或常用票据中的印章,输出文字内容、印章位置信息以及相关置信度,支持圆形章、椭圆形章、方形章等常见印章
销量:- 响应时长:- sla:-
图像风格转换
提供多种艺术风格特效转化服务,还可自定义风格图像进行风格迁移。用于开展趣味活动,或集成到美图应用中对图像进行风格转换。
销量:- 响应时长:- sla:-
文章分类生成
文章分类生成API是一款智能文本处理工具,用于自动分类各类文章并生成相关标签。
销量:- 响应时长:- sla:-
通用文字识别
通用文字识别API是一种先进的技术工具,能够从图像中准确抽取并转换各种形态的文字信息为可编辑的文本格式。
销量:- 响应时长:- sla:-
图像色彩增强
可智能调节图片的色彩饱和度、亮度、对比度,使得图片内容细节、色彩更加逼真。
销量:- 响应时长:- sla:-
短语音转文字
实现将多语种语音内容转换为文字,支持60s内音频文件转写以及实时语音转写。
销量:- 响应时长:- sla:-
数字识别
数字识别API是一项关键的计算机视觉技术,可高效精准地从图片中抓取与解析数字信息。
销量:- 响应时长:- sla:-
人脸对比
预集成
通过人脸比对,验证两张人脸照片是否为同一人,支持jpg,jpeg,png格式,通过AI算法模型,准确率达99%,毫秒级响应,支持高并发
销量:- 响应时长:- sla:-
社保卡识别
社保卡识别接口服务是一项基于先进图像识别技术的自动化服务,专为各类企业和开发者提供高效、准确的社保卡信息提取功能。该服务支持多种社保卡类型,通过调用API接口,用户可以轻松实现社保卡信息的快速识别与录入,提高业务处理效率和准确性。
销量:- 响应时长:- sla:-
商品图片搜索
针对商品类图片,专项训练检索模型,在自建图库中搜索相同及相似的商品图片集,可找到不同颜色、背景、角度的同款商品;适用于电商平台拍照搜商品等场景
销量:- 响应时长:- sla:-
品牌logo识别
品牌LOGO识别API用于检测和识别图片中的台标、品牌商标等logo信息。即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中logo的名称、位置和置信度。
销量:- 响应时长:- sla:-
快递物流单据识别
快递物流单据识别是一种提供快递物流单号查询的接口,涵盖了包括申通、顺丰、圆通、韵达、中通、汇通等快递公司的数据。
销量:- 响应时长:- sla:-
相同图片搜索
在自建图库中找到与检索图相同的图片,支持找到局部内容相同的大图,或适度调整背景和角度的相同图片;可用于图片精确查找、重复图片过滤等场景
销量:- 响应时长:- sla:-
文本相似度比较
它能够计算并确定两段文本之间的语义相似度。
销量:- 响应时长:- sla:-
短视频AI生成视频脚本
利用先进技术和深度学习算法,为各种类型的视频定制脚本。无论是宣传片、教育视频还是娱乐内容,系统能够快速生成富有创意和吸引力的脚本,节省时间和精力,提升视频制作效率和质量。
销量:- 响应时长:- sla:-
手写文字识别
检测识别图片中的手写中文、手写数字,针对不规则的手写字体进行专项优化,识别准确率可达90%以上
销量:- 响应时长:- sla:-
文本翻译
能够将源语言文本快速、准确地转换成目标语言文本。通过该服务,用户可以根据不同的语言参数实现多种国际语言之间的互译,满足用户在跨语言交流、学习和工作中的翻译需求。
销量:- 响应时长:- sla:-
车辆合格证识别
从车辆合格证的图像文件中提取关键信息,如车辆品牌、型号、发动机编号、制造日期、发证单位、唯一序列号等重要参数。
销量:- 响应时长:- sla:-
行驶证识别
行驶证识别是一项利用光学字符识别(OCR)技术和图像处理技术来自动识别机动车行驶证信息的技术方案。这项技术主要用于快速、准确地提取行驶证上的关键字段信息,例如号牌号码、车辆类型、所有人姓名、住址以及其他重要的车辆登记信息。
销量:- 响应时长:- sla:-
人脸帐户创建付费项
预集成
人脸帐户创建付费项
销量:- 响应时长:- sla:-
人体关键点识别
检测图片中人体的关键点。建议用于人体图像清晰、无遮挡的场景。支持一张图片中存在多个人体的识别。
销量:- 响应时长:- sla:-
长文本在线合成语音
一次性合成长文本:最高支持10万字文本一次性合成,无需拆分文本和拼接音频,调用便捷,异步返回音频,并支持下载到本地反复使用
销量:- 响应时长:- sla:-
护照识别
护照识别接口服务提供了一种快速、准确地识别护照信息的方法。通过该接口,您可以上传护照照片,系统将自动识别护照上的关键信息,如姓名、护照号码、国籍、出生日期等。
销量:- 响应时长:- sla:-
图像修复
图像修复API利用深度学习技术,可修复模糊、损坏等低画质图像,适用于历史文献、安防监控、创意设计、个人照片、艺术品等领域。一键实现高清还原,为用户提供优质的图像修复服务。
销量:- 响应时长:- sla:-
拉伸图像恢复
通过人工智能算法,自动识别过度拉伸的图像,并将图像内容恢复成正常比例。
销量:- 响应时长:- sla:-
果蔬识别
对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中的果蔬食材结果。
销量:- 响应时长:- sla:-
文章标题生成
智能标题生成API运用先进NLP技术,为用户提供高质量、关键词优化的标题。它快速解析文本,产出新颖独特、符合内容主旨的标题选项,助力提升点击率与搜索引擎排名。
销量:- 响应时长:- sla:-
网络图片文字识别
能够快速准确识别各种网络图片中的文字,在复杂字体和复杂背景的情况下仍能保持非常高的识别准确率
销量:- 响应时长:- sla:-
图像对比度增强
调整过暗或者过亮图像的对比度,使图像更加鲜明。
销量:- 响应时长:- sla:-
活体检验
预集成
分析用户提交的自拍照片,判断内容中是否存在hack行为,验证当前用户是否为实人实时操作,以防御各种非真人的人脸攻击。检测成功会返回一张人脸照片用于人脸比对验证。多用于远程身份核验场景。
销量:- 响应时长:- sla:-
地址解析聚合
该服务用于解析地址结构。结合自然语言理解能力,可以对地址信息按照文本信息、空间位置信息等因子进行区域化聚合,同时也可解析并提取地址中核心结构。如行政区划(省、市、区、乡镇、村)、街道、POI、楼栋、门牌号,以及地址中的联系人,联系方式等信息,并对地址进行一定的补全和纠错并返回结构化的地址。
销量:- 响应时长:- sla:-
情感倾向分析
情感倾向分析API服务是一种基于人工智能技术的工具,用于自动识别和量化文本数据(如社交媒体帖子、产品评论、新闻文章等)中蕴含的情感色彩
销量:- 响应时长:- sla:-
实时语音转文字
实时语音转文字API服务利用深度学习技术,快速准确地将语音信号转换成文字。适用于智能客服质检、会议访谈转写、游戏语音输入、课堂内容分析等场景。
销量:- 响应时长:- sla:-
户口本识别
户口本识别接口服务是一款基于AI深度学习技术,专门针对电子或纸质版户口本进行快速、准确识别的云端API服务。
销量:- 响应时长:- sla:-
结婚证识别
支持对结婚证进行结构化识别,包括姓名、身份证件号、出生日期、国籍、性别等字段。
销量:- 响应时长:- sla:-
人像动漫化
运用对抗生成网络技术,结合人脸检测、头发分割、人像分割等技术,为用户量身定制千人千面的二次元动漫形象,并支持通过参数设置,生成戴口罩的二次元动漫人像
销量:- 响应时长:- sla:-
文本内容审核
基于自然语言理解、深度学习等技术,有效识别违规文本内容。
销量:- 响应时长:- sla:-
VIN码识别
VIN码识别是一项基于光学字符识别(OCR)技术的应用程序和服务,它允许通过图像自动识别并提取汽车车身上的唯一车辆识别号码(Vehicle Identification Number,简称VIN)。
销量:- 响应时长:- sla:-
黑白图像上色
智能识别黑白图像内容并填充色彩,使黑白图像变得鲜活
销量:- 响应时长:- sla:-
图像主体检测
用户传入图片通过后台算法判断图片主体,并返回主体坐标。
销量:- 响应时长:- sla:-
二维码识别
对图片中的二维码、条形码进行检测和识别,返回存储的文字内容。支持识别多种类型的二维码。快速解析二维码中包含的丰富信息,无论是网址、文本、联系人数据还是其他各种类型的编码内容。
销量:- 响应时长:- sla:-
MapReduce
MapReduce是一种分布式编程模型和计算框架,由Google提出并在Apache Hadoop中实现,主要用于大规模数据集的并行处理。
销量:- 响应时长:- sla:-
垂直领域翻译
垂直领域翻译API服务是针对特定行业需求设计的翻译解决方案。通过专业术语和语言风格的处理,确保翻译结果准确无误。
销量:- 响应时长:- sla:-
通用物体和场景识别
该API用于通用物体及场景识别,即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中的多个物体及场景标签。
销量:- 响应时长:- sla:-
相似图片搜索
在自建图库中找到与检索图片语义相似的图片集,并给出相似度打分(综合图片类型、颜色、内容、布局等特征);适用于各种相似图片查找、相关内容推荐场景
销量:- 响应时长:- sla:-
人流量统计
对于输入的一张图片(可正常解码,且长宽比适宜),识别和统计图像当中的人体个数。
销量:- 响应时长:- sla:-
植物识别
根据上传的植物图片,识别植物信息。
销量:- 响应时长:- sla:-
营业执照OCR识别
预集成
双引擎识别:企业营业执照OCR识别同时,进行企业工商信息查询比对。
销量:- 响应时长:- sla:-
短文本在线合成语音
提供风格多样的19种音库供您选择,适用于有声阅读、新闻播报、订单播报、智能硬件等应用场景,即将推出更多特色音库
销量:- 响应时长:- sla:-
对象存储 OSS
对象存储服务(OSS,Object Storage Service)是一种安全、稳定、高效且易于管理的数据存储解决方案,可用于文件上传。
销量:- 响应时长:- sla:-
图像清晰度增强
图像清晰度增强API服务利用先进的图像处理技术,提升图像的清晰度和对比度,广泛应用于医学影像诊断、安防监控、卫星遥感、数字图书馆、媒体编辑、智能交通等领域。
销量:- 响应时长:- sla:-
文章标签生成
文章标签生成API利用深度学习与NLP技术,自动从文本中提取核心词,生成精准标签与摘要,实现内容智能化管理。
销量:- 响应时长:- sla:-
机动车销售发票识别
识别机动车销售发票的关键字段,包括发票代码、号码、开票日期、机器编号、购买方信息、车辆信息、销货单位信息、价税合计、价税合计小写、税率、税额、不含税价格等
销量:- 响应时长:- sla:-
港澳台通行证识别
支持识别4类港澳台出入境证件,包含港澳通行证正/反面、台湾通行证正/反面、台胞证(台湾居民来往大陆通行证)正/反面、返乡证(港澳居民来往内地通行证)正/反面进行高精准结构化识别,包括证件号码,签发机关、姓名、姓名拼音、性别、出生日期、有效期限、签发地点
销量:- 响应时长:- sla:-
人脸搜索
人脸搜索API是一种基于深度学习的人脸识别技术接口,它能高效、准确地从大规模人脸库中查找与输入人脸图像相似的个体。
销量:- 响应时长:- sla:-
车牌识别
车牌识别技术是一项基于图像处理和人工智能的先进技术,旨在对车辆上的车牌进行自动定位和识别。
销量:- 响应时长:- sla:-
地标识别
获得输入图片的地标名称、经纬度、可信度等信息,可信度越高代表输入图片中的地标越有可能是识别出的地标。基于获得的信息可进行旅游地点识别,可以为用户创造更加个性化应用体验。
销量:- 响应时长:- sla:-
银行卡OCR识别
预集成
银行卡OCR识别_图像识别OCR_银行卡信息识别,支持识别银行卡正面信息,包含银行卡号、银行卡类型、银行名称、银行代码等信息, 识别是否翻拍,是否复印件并返回结果。
销量:- 响应时长:- sla:-
对话情绪识别
在对话场景中,识别对话双方文本背后蕴含的用户情绪
销量:- 响应时长:- sla:-
表格文字识别
表格文字识别Api用于识别并结构化输出图像中的表格数据。该服务适用于多种应用场景,如财务报表录入、文档数字化管理等
销量:- 响应时长:- sla:-
Elasticsearch
Elasticsearch 是一个开源、分布式、实时搜索与数据分析引擎,以其高可扩展性和近实时搜索能力著称。
销量:- 响应时长:- sla:-
图像无损放大
图像无损放大API是一项高级的图像处理服务,能够在保持图像质量的前提下,将图像在长宽方向各放大两倍。
销量:- 响应时长:- sla:-
文章关键词生成
文章关键词生成API利用自然语言处理与机器学习技术,从文本中精准提取代表性关键词。服务涵盖词频统计、TF-IDF计算、主题模型分析等,确保关键词反映原文主旨。
销量:- 响应时长:- sla:-
专用API 专用API
百度智能搜推引擎服务
智能搜推引擎依托百度 AI 技术及 C 端流量运营优势,针对金融、互联网、传媒等行业私域流量分发运营场景,提供内容资讯、商品与媒资物料的搜索推荐服务,助力显著提高客户端用户活跃度、留存及收益。
EasyDL 自然语言处理方向
基于文心·NLP大模型领先的语义理解技术,为企业/开发者提供一整套NLP定制与应用能力
多模态媒资检索MMS-百度智能云
多模态媒资检索MMS-百度智能云基于视频指纹特征与视频内容理解,实现多模态的搜索能力,主要包含以视频搜视频、以图搜视频、以图搜图等功能,赋予用户多模态的高效、精准、智能的搜索能力。
数据可视化 Sugar BI-百度智能云
Sugar BI是百度智能云推出的敏捷 BI 和数据可视化平台,通过拖拽图表(chart)组件可实现 5 分钟搭建数据可视化页面,组件丰富,开箱即用,无需SQL和任何编码。通过可视化图表及强大的交互分析能力,企业可使用 Sugar BI有效助力自己的业务决策。
百度智能云视频内容分析
利用视觉、语音、NLP等AI技术,对视频、图片、文本进行结构化分析,输出场景、公众人物、地点、实体和关键词等结构化标签,还可生成封面图和高光片段,帮助平台实现自动化内容理解,为个性化内容推荐、提升用户检索体验提供基础
数据转视频-百度智能云
提供多类图表模版,用户仅需上传数据,即可生成美观的可视化图表动画,同时满足数据化和视频化的叙事需求
图像内容理解-百度智能云
图像理解视觉大模型,可多维度识别与理解图片内容,包括人、物、行为、场景、文字等,支持输出对图片内容的一句话描述,同时返回图片的分类标签、文字内容等信息
语言理解技术-百度智能云
提供全面、领先的NLP语言理解技术,涵盖词、短语、句子等不同粒度的底层能力,您可将其应用于多种技术和业务方向
智能财务票据识别服务-百度智能云
针对财务场景中13类常见票据,进行智能分类及结构化识别,无需提前进行手动分类处理,上传图片即可完成自动分类、识别及信息提取。助力企业内部报销、代理记账等业务场景效率升级,降低企业运营成本
智能创作平台-百度智能云
基于百度领先的AI多模态技术,集成文本生成视频、模板视频、图片生成和图文写作等智能创作工具,全方位赋能媒体、金融、政企等行业的高效内容创作。AI助力,让高品质内容一步到位!
智能结构化识别服务-百度智能云
基于业界领先的深度学习技术和图像检测技术,支持智能提取图片中的字段结构化信息,无需训练灵活提取,用于各类证照、票据、表单等版式中的结构化信息录入场景
智能文档分析平台-百度智能云
基于百度文心大模型4.0打造的一站式文档处理智能助手,涵盖合同审查、文档格式转换、文档比对等多项功能,为用户提供高效、便捷的文档处理体验,助力企业轻松应对海量文档,有效规避潜在风险
自然语言处理技术-百度智能云
自然语言处理技术是一系列AI技术的集合,旨在使计算机能够理解、解释和生成人类的自然语言。它涵盖深度学习、语言模型、语义分析等多个子领域,能够处理如文本分类、情感分析、信息提取等多种语言理解及生成任务。
千帆大模型-百度智能云
百度智能云千帆大模型平台(以下简称千帆或千帆大模型平台)是面向企业开发者的一站式大模型开发及服务运行平台。千帆不仅提供了包括文心一言底层模型和第三方开源大模型,还提供了各种AI开发工具和整套开发环境,方便客户轻松使用和开发大模型应用。 支持数据管理、自动化模型SFT以及推理服务云端部署的一站式大模型定制服务,助力各行业的生成式AI应用需求落地。
实时语音识别-百度智能云
WebSocket 是基于TCP的全双工协议,即建立连接后通讯双方都可以不断发送数据。 WebSocket 协议由rfc6455定义, 下面介绍常见WebSocket 库的调用流程及参数 一般需要各编程语言的WebSocket库来实现接入。WebSocket库需支持rfc6455描述的协议, 即支持Sec-WebSocket-Version: 13
位置服务
面向B/G两端提供专业的位置服务,百度地图作为中国领先的智能化位置服务平台,深度赋能各行各业,并为行业合作伙伴提供一站式的地图解决方案。
百度直播内容安全服务
可对直播平台上的视频流、音频流、弹幕/评论等内容进行实时审核,覆盖色情、暴恐、政治敏感、广告、违禁事物等多种审核纬度,大幅降低平台风险和人工审核成本。
视频内容安全
基于图像、文本、语音技术的综合审核能力,准确过滤视频中的色情、广告、恶心、违禁等违规内容,也能从美观、清晰等维度对视频进行筛选,紧贴业务需求,提升视频审核效率。
视频质量检测
视频质量检测服务基于视频文件在录制、传输和存储过程中可能会出现数据损坏从而导致视频数据中出现一些缺陷的需求场景考虑,通过智能算法,对画面模糊、花屏、噪声等问题的视频画面进行批量分析、评估、得出结论,帮助用户快速定位问题,提高视频传统技审效率。
百度媒体内容分析-个性化推荐
利用视觉、语音、知识图谱等AI技术,对视频和图片进行结构化分析,输出内容的泛标签,帮助平台实现个性化内容推荐,提升用户检索体验,促使业务有效转化。
音视频处理
音视频处理针对海量媒资提供高效、智能、稳定的音视频处理服务,包括:普通转码、倍速转码、智感超清转码、智能处理与编辑、视频加密、智能抽帧、视频质检等,实现多终端高清流畅播放体验。
实时音视频
实时音视频 RTC(Real-Time Communication),依托百度云强大的实时音视频处理与传输能力、覆盖全球的低延时网络,提供稳定高质量的实时音视频服务,帮助客户快速搭建多平台实时音视频应用。
智感超清
智感超清转码基于百度智能编码技术,对视频场景、画面、内容等进行智能分析,动态分配码率。同时使用AI技术对画面进行预处理,保证节省更多的带宽同时提升更高画质。
语音通知
语音通知服务是基于百度智能云强大的语音线路资源打造的语音消息通知应用服务。语音消息具有高到达率、超低延时、秒级触达的优势,致力于提供优质的语音消息服务。
语音通话
语音通话服务是面向具备平台开发能力的企业客户,通过互联网接入形式,提供即时语音通信能力的PAAS产品。
号码隐私保护服务
号码隐私保护服务(Privacy Number Service,简称PNS)为用户或企业分配隐私号码,保证通话过程中号码信息不被泄露。并可通过隐私号对通话进行录音,提升服务安全性及服务质量。同时可在信息隔离的使用场景中,做流量的监控。
号码认证服务
涵盖号码多要素认证、空号检测、二次放号服务,支持三大运营商,场景覆盖政务、企业、生活方方面面,通过客户的测试和认可。
移动App推送服务
百度慧推是商用级移动消息PUSH服务。依托百度安全技术,支持普通通知消息、纯图消息、透传消息、AB测试等功能,拥有丰富的用户标签体系,可以满足个性化推送需求。
密钥管理服务
密钥管理服务(Key Management Service)是一款安全管理类服务, 使用符合国家要求的 HSM 设备帮助用户妥善的保管密钥类数据。 用户可以按照自己的需要,创建自己的主密钥、凭据、证书等机密数据,并完成加密、解密、签名、验签、校验等各种操作。
风控知识库
基于长期与黑产持续对抗沉淀的安全因子、策略模型,精准识别各场景下业务风险,提供设备、IP、应用等多维度风险画像数据。补充合作企业黑产情报数据,建立更完善的事前风险感知能力、强化风险设备识别能力。
号码安全服务
为企业号码提供认证,提供号码安全标签查询,一站式解决号码营销安全问题,搭建企业与用户之间信任的桥梁!号码安全服务包含企业号码认证服务、号码标签查询服务。
流式计算
流式计算(Baidu Stream Computing,简称BSC)提供云端的流式数据实时处理的完全托管式服务,提供低延迟、高吞吐、高准确性的流式数据实时处理能力。
日志服务
日志服务BLS是一站式实时日志分析服务,提供日志数据采集传输、检索分析、实时消费与转储等功能,帮助用户轻松应对服务运维管理、商业趋势洞察、安全监控等业务场景。
百度AI成片
输入图文素材,一键生成短视频,自动实现配音、加字幕、素材匹配、添加数字人形象等环节。适用于企业宣传、营销推广、知识科普等场景,帮助创作者实现精美视频的快速产出
AI作画
国内首个技术自研、基于大模型的通用且可控的文生图系统,可基于自然语言智能生成不限定风格的图像,面向有图片创作需求的开发者提供API调用服务,为内容创作者提供灵感和高质量配图
货币识别
识别图像中的货币类型,返回货币名称、代码、面值、年份信息,可识别百余种国内外常见货币;还可使用EasyDL定制训练平台,定制识别货币种类
红酒识别
识别图像中的红酒标签,返回红酒名称、国家、产区、酒庄、类型、糖分、葡萄品种、酒品描述等信息,可识别数十万中外红酒;支持自定义红酒图库,在自建库中搜索特定红酒信息
菜品识别
识别超过9千种菜品,支持客户创建属于自己的菜品图库,可准确识别图片中的菜品名称、位置,并获取百科信息,适用于多种客户识别菜品的业务场景中
百度离线语音生成服务-多平台
在无网或弱网环境下,可在手机APP或故事机、机器人等智能硬件设备终端进行语音播报,将文字合成为声音,提供稳定一致、流畅自然的合成体验
短语音识别极速版
将60秒内的语音快速识别为文字,适用于手机语音输入、语音搜索、人机对话等语音交互场景
检查报告单据识别
针对医疗场景常见的检查报告相关单据进行结构化识别,包括医疗检验报告单、医疗诊断报告单2种常见单据,可应用于在线智能问诊、医患信息电子化录入等场景
病历单据识别
对保险理赔场景所涉及的病历相关单据进行结构化识别,包括病案首页、出院小结、入院小结、门诊病历、诊断证明、处方笺、手术记录等7种常见单据,应用于智能理赔核保场景,有效降低人工审核成本,提升业务办理效率
医疗费用结算单识别
结构化识别全国各类医疗费用结算单,包含费用汇总信息、非药品/项目列举清单,返回姓名、出/入院时间、发票总金额、自费金额、医保支付金额 6 个关键字段
医疗费用明细识别
结构化识别全国各地门诊、住院发票(含全国统一发票和电子票)的所有字段信息,包括姓名、金额大/小写、收费项目明细、各省直辖市的专有信息,支持21 个城市收费项目信息的医保三目录信息核验
医疗发票识别
结构化识别全国各地门诊、住院发票(含全国统一发票和电子票)的所有字段信息,包括姓名、金额大/小写、收费项目明细、各省直辖市的专有信息,支持21 个城市收费项目信息的医保三目录信息核验。
购物小票识别
支持识别各类商场、超市及药店的购物小票,包括店名、单号、总金额、消费时间、明细商品名称、单价、数量、金额等信息,可用于商品售卖信息统计、购物中心用户积分兑换及企业内部报销等场景
定额发票识别
对各类定额发票进行结构化识别,可识别发票代码、发票号码、金额、发票所在地、发票金额小写、省、市7个关键字段。
通用机打发票识别
对国家/地方税务局发行的横/竖版通用机打发票进行结构化识别,可识别23个关键字段,包括发票类型、发票号码、发票代码、开票日期、商品名称、合计金额等。
差旅报销票据识别服务
对财务报销场景所涉及的常见差旅票据进行结构化识别,包括火车票、出租车票、网约车行程单、汽车票、飞机行程单、过路过桥费发票、船票等7种常见票据,应用于企业税务核算及内部报销场景
银行单据识别服务
支持识别各类不同版式的银行金融单据,包括银行回单、支票、汇票3类金融票据,可应用于企业内部做账及税务核算等场景。
办公文档识别
可对办公类文档的版面进行分析,输出图、表、标题、文本、目录、印章、栏、页眉、页脚、页码和脚注的位置,并输出分版块内容的OCR识别结果,支持表格识别和印章识别,支持中、英两种语言,手写、印刷体混排多种场景。
×
完成
取消
×
书签名称
确定