官方
|
北京火山引擎科技有限公司 |
去官网
|
火山引擎是字节跳动旗下的云服务平台, 将字节跳动快速发展过程中积累的增长方法、技术能力和工具开放给外部企业,提供云基础、视频与内容分发、数智平台VeDI、 人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。 |
- 服务列表(121)
- 关于我们
商标证书OCR识别 | |
利用光学字符识别(OCR)技术对商标证书上的文字信息进行识别和提取商标证书上的关键信息,如商标注册号、商标图样、注册人信息等,从而方便进行商标信息的整理、查询和管理。
|
|
销量:- | 响应时长:- | sla:- |
Prometheus | |
Prometheus是一款开源的系统监控与警报工具,由SoundCloud开发并捐献给Cloud Native Computing Foundation。它具备强大的数据采集、存储以及查询功能,适用于以时间序列数据为模型的监控场景。
|
|
销量:- | 响应时长:- | sla:- |
销量:- | 响应时长:- | sla:- |
港澳台通行证识别 | |
支持识别4类港澳台出入境证件,包含港澳通行证正/反面、台湾通行证正/反面、台胞证(台湾居民来往大陆通行证)正/反面、返乡证(港澳居民来往内地通行证)正/反面进行高精准结构化识别,包括证件号码,签发机关、姓名、姓名拼音、性别、出生日期、有效期限、签发地点
|
|
销量:- | 响应时长:- | sla:- |
销量:- | 响应时长:- | sla:- |
手势识别 | |
识别图片中的手势类型,返回手势名称、手势矩形框、置信度等信息,可识别常见手势,适用于手势特效、智能家居手势交互等场景。识别质量受拍摄距离、图片质量影响,建议针对近距离单个手势进行识别,效果最佳。
|
|
销量:- | 响应时长:- | sla:- |
PostgreSQL | |
云原生数据库 PostgreSQL 版100%兼容 PostgreSQL,高度兼容Oracle语法。为用户提供快速弹性、高性能、海量存储、安全可靠的数据库服务。
|
|
销量:- | 响应时长:- | sla:- |
Elasticsearch | |
Elasticsearch 是一个开源、分布式、实时搜索与数据分析引擎,以其高可扩展性和近实时搜索能力著称。
|
|
销量:- | 响应时长:- | sla:- |
销量:- | 响应时长:- | sla:- |
HBase | |
云数据库 HBase 版是面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力。
|
|
销量:- | 响应时长:- | sla:- |
redis | |
Redis是一种开源、高性能的键值对数据库,以内存存储为主,支持持久化。它提供了丰富的数据结构如字符串、哈希表、列表、集合、有序集合等,并具备发布/订阅、事务、Lua脚本等功能。
|
|
销量:- | 响应时长:- | sla:- |
块存储(云硬盘) | |
块存储服务(通常称为云硬盘)是一种基于云计算环境的高性能、高可靠的数据存储解决方案。它为用户提供可扩展的、类似于物理硬盘的虚拟块存储空间,能够即插即用地挂载到云服务器上,实现数据的高效读写与持久化存储。
|
|
销量:- | 响应时长:- | sla:- |
销量:- | 响应时长:- | sla:- |
视频点播 | |
视频点播(ApsaraVideo VOD,简称VOD)是集视频采集、编辑、上传、媒体资源管理、自动化转码处理(窄带高清™)、视频审核分析、分发加速于一体的一站式音视频点播解决方案。
|
|
销量:- | 响应时长:- | sla:- |
销量:- | 响应时长:- | sla:- |
销量:- | 响应时长:- | sla:- |
销量:- | 响应时长:- | sla:- |
销量:- | 响应时长:- | sla:- |
销量:- | 响应时长:- | sla:- |
增值税发票OCR识别
预集成
|
|
识别增值税普票、机动车发票、火车票、PDF电子票、行程单等类型发票的基本信息、销售方及购买方信息、商品信息、价税信息等,并转化为文字/数字。
|
|
销量:- | 响应时长:- | sla:- |
身份证人像面识别
预集成
|
|
身份证人像面OCR识别,支持识别身份证正面文字信息,通过比对姓名和身份证号,实时联网核查核验是否一致并返回结果。支持对URL网络图片和Base64信息进行识别,支持PNG、JPG、JPEG格式,双引擎识别。
|
|
销量:- | 响应时长:- | sla:- |
销量:- | 响应时长:- | sla:- |
销量:- | 响应时长:- | sla:- |
销量:- | 响应时长:- | sla:- |
销量:- | 响应时长:- | sla:- |
银行卡OCR识别
预集成
|
|
银行卡OCR识别_图像识别OCR_银行卡信息识别,支持识别银行卡正面信息,包含银行卡号、银行卡类型、银行名称、银行代码等信息, 识别是否翻拍,是否复印件并返回结果。
|
|
销量:- | 响应时长:- | sla:- |
行驶证识别 | |
行驶证识别是一项利用光学字符识别(OCR)技术和图像处理技术来自动识别机动车行驶证信息的技术方案。这项技术主要用于快速、准确地提取行驶证上的关键字段信息,例如号牌号码、车辆类型、所有人姓名、住址以及其他重要的车辆登记信息。
|
|
销量:- | 响应时长:- | sla:- |
活体检验
预集成
|
|
分析用户提交的自拍照片,判断内容中是否存在hack行为,验证当前用户是否为实人实时操作,以防御各种非真人的人脸攻击。检测成功会返回一张人脸照片用于人脸比对验证。多用于远程身份核验场景。
|
|
销量:- | 响应时长:- | sla:- |
销量:- | 响应时长:- | sla:- |
销量:- | 响应时长:- | sla:- |
大模型声音复刻-火山引擎 | |
大模型声音复刻基于全自研最新语音大模型打造的超轻量级音色定制方案,开放环境中录制秒级别录音即可极速拥有专属定制音色,广泛应用于视频配音、数字人驱动、语音助手、在线教育等场景。
|
|
北京火山引擎-边缘智能 | |
边缘智能平台专为现场边缘领域的业务场景设计,它与云原生生态完全兼容,并融合了物联网和人工智能的应用能力。通过边缘云基础设施,我们能帮助您构建出具有高度可靠性的云边智能解决方案。
|
|
北京火山引擎-火山方舟大模型服务平台 | |
火山方舟是面向开发者的企业级大模型服务平台,提供模型训练、推理、评测、精调等全方位功能与服务,并重点支撑大模型生态。
|
|
北京火山引擎-视频技术 | |
北京火山引擎视频处理技术,涵盖内容生成、理解与编辑。支持视频编辑、增强、分割,自动识别精彩瞬间,智能选取封面。适用于短视频、直播、教育、传媒等行业,提升视频制作效率和吸引力。
|
|
北京火山引擎-音频技术 | |
音频技术(SAMI)专注于语音合成、音频处理、音乐理解与创作。我们的优势在于音乐与音频的多模态技术融合,自主研发的算法追求卓越性能。我们的目标是利用AI激发创作者的灵感,为用户带来创新的交互体验,探索声音的无限潜力。
|
|
北京火山引擎-智能变美 | |
基于深度学习算法,对包含人像人体内容的图像进行智能编辑与处理,包括人像编辑、人像技术、人体与行为分析等功能,可满足用户对于人像人体编辑的多元化需求,可应用于互联网娱乐、互动营销、智能图像优化、安全认证等各类场景。
|
|
北京火山引擎-智能处理 | |
北京火山引擎-智能处理支持画质检测、画质增强、高清低码、老片修复、视频DNA等,提供全流程视频前后智能处理。
|
|
北京火山引擎-智能创作云 | |
火山引擎的智能创作云,专为企业设计,集成AIGC创作、视频混剪等AI工具,搭配丰富模板和版权素材库。一站式服务覆盖内容创作、分发、广告投放及数据分析,全面助力企业内容营销效率和效果提升。
|
|
北京火山引擎-智能广告营销平台 | |
火山引擎的iAd平台,即智能广告营销平台,提供一站式解决方案,覆盖企业数字营销全流程。通过创意资产管理、智能广告投放和多渠道效果分析,助力企业实现公私域一体化的全渠道营销管理,推动业务增长。
|
|
北京火山引擎-智能绘图 | |
利用深度学习技术,智能编辑处理图像中的人像和人体,提供人像美化、技术优化和行为分析服务,满足多样化编辑需求,广泛应用于娱乐、营销、图像优化和安全验证等多个场景。
|
|
北京火山引擎-智能绘图文本转图片通用版 | |
北京火山引擎智能绘图(文本转图片通用版)多模态通用图片生成,可以基于文字输入生成逼真且通用的图片,用户可通过输入文本prompt描述图片内容并自定义风格特征,模型输出对应风格化的图片。
|
|
北京火山引擎-智能美化特效 | |
智能美化特效SDK是基于计算机视觉智能算法、超大规模的人脸检测和识别技术的特效库。可为创作者提供适用于移动端(iOS/Android)的自动图像美化、人脸美颜、特效加工等辅助编辑功能。
|
|
北京火山引擎-智能视频分析 | |
智能视频分析,是基于深度学习视频结构化图像处理技术对视频图像进行处理分析的综合性平台,其核心是对视频结构化分析技术的应用。
|
|
北京火山引擎-智能数据洞察 | |
智能数据洞察 DataWind 是一款基于大数据明细级别分析的增强型 DataWind 平台。能够提供万亿级数据、亚秒级查询的计算性能,支持丰富的可视化效果和简易的拖拽式操作,能够融合 AI 技术对数据进行智能洞察。
|
|
北京火山引擎-智能推荐平台 | |
智能推荐平台依托字节跳动领先的大规模机器学习和个性化推荐技术,借助在信息资讯、视频直播、社交、电商等多个领域的能力积累,为客户提供端到端的一站式推荐服务能力搭建的平台,满足不同场景客户的推荐需求。
|
|
北京火山引擎-智能外呼 | |
火山引擎智能外呼是基于行业领先的自研语音对话技术与丰富的细分场景运营经验,打造的真实互动语音外呼机器人。可以精准识别对话意图,构建自然流畅的语音服务体验,全面助力企业智能化营销,创造极致业务价值。
|
|
北京火山引擎-实时音视频 | |
亿级 DAU 产品验证打磨的音视频最佳实践,提供全球范围内高质量、低延时的实时音视频通信能力,帮助开发者快速构建语音通话、视频通话、互动直播、转推直播等丰富的场景功能。
|
|
北京火山引擎-音视频字幕 | |
基于语音识别技术,能够自动将音/视频中的语音、歌词转换为字幕文本,适用于辅助视频字幕创作和外挂字幕自动生成。产品支持多个语种的识别、打轴,是完美适配视频创作和视频观看场景的智能字幕解决方案。
|
|
火山引擎人像年龄变换 | |
人像年龄变换可用于改变用户脸部年龄,包括变小孩,变老等。此外,年龄渐变又可以衍生成为新的玩法,有很大探索空间。
|
|
火山引擎视频画质评分 | |
对输入视频进行多维度画质评分,包括清晰度、亮度、噪声、色彩、美观度、有无边框等。
|
|
火山引擎图片方向矫正 | |
图片方向矫正可以检测场景图片中存在的透视不和谐问题,并进行自动矫正,让图片看上去更美观精致。适用于风景拍摄,应用场景广泛。
|
|
火山引擎高速公路过路费票识别 | |
支持对高速公路过路费发票中的所有关键字段进行检测、识别以及进行结构化解析,得到发票代码、入口站、出口站、日期、通行费、盖章公司名称等关键信息,满足财会报销场景的多样化信息提取需求。
|
|
火山引擎增值税卷票识别服务 | |
支持对增值税卷票所有关键字段的检测、识别与解析,识别准确度高,适应多种复杂场景,支持对票据图片进行方向判断和裁剪修正服务。
|
|
火山引擎多语种OCR识别 | |
多语种OCR服务支持中英文、日语、法语、德语、俄语、西班牙语等50+语种的文字识别能力。向客户提供文字识别结果、语种等多种关键信息。为多语种场景下的图片文字识别、提取提供完整解决方案。
|
|
火山引擎图片涂抹编辑 | |
用户可通过涂抹、选区等方式建立重绘区域,调用算法重新绘制。此功能为支持输入prompt的涂抹编辑功能,按照prompt生成指定内容。考虑效果更优,建议一次性给客户返回3-4个效果供客户进行挑选。
|
|
火山引擎图片涂抹消除 | |
用户可通过涂抹、选区等方式建立重绘区域,调用算法重新绘制。此功能为不支持输入prompt的消除功能,在路人消除、杂物消除、水印消除等任务表现较好,建议一次性给客户返回3-4个效果供客户进行挑选。 算法侧会出现一定概率生成「AI鬼脸」的问题,算法侧会返回错误码(201304),建议业务方可通过判断错误码显示兜底图片或自行处理。
|
|
火山引擎文生图-高美感通用版 | |
高美感通用V1.3是通用场景的文生图模型,其在美学水平和V1.2保持接近,图文匹配度和结构准确性相较V1.2有较大提升,生成的图片可支持*2超分,可支持通用场景下的文生图功能。
|
|
火山引擎文生图-高美感动漫版 | |
高美感动漫模型V1.3聚焦动漫等艺术风格化场景,美学理解、镜头知识理解与整体效果均有显著提,本接口同时支持文生图与图生图。
|
|
火山引擎图生图-高美感动漫版 | |
高美感通用V1.1是聚焦动漫场景的图生图模型,支持超分处理,整体表现均衡稳定,在图文匹配度、结构准确性与图像效果均有较好表现。
|
|
火山引擎图生图-高美感通用版 | |
高美感通用V1.1是通用场景的图生图模型,整体在图文匹配度、结构准确性与图像效果均有较好表现。
|
|
火山引擎3D游戏特效 | |
3D游戏特效以GAN技术为核心,将人脸/全图转化为3D游戏风。3D特效让用户的形象更有空间立体感, 可以一比一生成3D效果,可用于游戏展、cosplay大会、大型游戏比赛等活动宣传。
|
|
火山引擎希区柯克特效 | |
希区柯克特效基于人像分割技术,实现照片2D转3D,达到3D裸眼慢动作的效果。将自拍图像与背景图片运用希区柯克技术无感融合,开启场景拉伸的视频拍摄新玩法,可用于个人社交娱乐、影视剧效果模拟拍摄等。
|
|
火山引擎人像畸变矫正 | |
人像畸变矫正基于深度学习算法,智能修复因镜头畸变对人像产生的拉伸和变形。适用场景有智能图像优化, 如图库、社交、PUGC内容平台的图像质量优化场景,高效解决人像畸变的问题。
|
|
火山引擎140种文本语种检测 | |
文本语种检测服务目前支持140种语言的识别检测,可识别文本所属语言种类,返回最可靠的结果。广泛应用于通用文本、商务沟通、搜索、广告、游戏等场景语种识别任务。
|
|
火山引擎视频场景识别 | |
对视频内容进行识别分析,输出自然风光、日常生活等数千种场景、风格及内容属性标签。
|
|
火山引擎通用图像分割 | |
检测图像中的主体并识别轮廓,实现精细化分割抠图能力,对镂空主体及复杂背景均有良好效果,并分割图片中的前景主体,适用于人像、食物等通用场景。
|
|
火山引擎商品图像分割 | |
识别图像中的主体商品轮廓,并与背景分离,返回分割后的前景商品图(4通道),对镂空主体、多商品及复杂背景均有良好抠图效果。除商品分割以外,本接口还提供人像以及通用物体的分割抠图能力,可以实现人像和通用物体的精细化分割。
|
|
火山引擎在线节拍检测 | |
BeatTracking 为用户提供节拍检测能力,自动分析获取音乐的节拍点,发现音乐的更多信息,辅助音乐资源利用。
|
|
计算 |
存储 |
数据库 | 容器与中间件 |
人工智能与机器学习 | 网络 | CDN与边缘 | 大数据 |
视频云 | 安全 | 企业服务与云通信 | 查看全部产品 |
企业上云
基于多云开放的高可用架构,火山引擎帮助企业业务快速云上部署,保障业务运行稳定,不断追求极致性能,使企业云上每一次计算及存储都能获得最优配置。
音视频
基于字节跳动音视频场景下的产品与运营实践,火山引擎为客户提供覆盖全场景云端一体音视频解决方案,一站获取完备音视频能力,助力业务创新敏捷落地。
智能营销
基于抖音集团的用户增长方法论,火山引擎从业务视角出发,持续串联内容生产、内容管理、公私域运营等环节,提供覆盖营销全链路的完整解决方案。
汽车行业
基于抖音集团在智能与数据领域的沉淀,火山引擎以“智能驾驶云”、“智能座舱云”、“体验运营云”为核心,打造个性化的互动智能座舱,提升全生命周期用户体验,构建精细化用户运营和业务增长能力。
金融行业
基于字节跳动的技术积累,火山引擎为金融机构提供从底层技术架构到技术中台,再到各类智能应用的全方位技术支持,构建数字敏捷,激发金融活力。
文娱行业
基于抖音集团稳定的基础产品能力、数据驱动的营销增长套件、AI加持的智能互动产品与多媒体技术,火山引擎为企业构建稳定业务、扩大用户触点、驱动交互创新、实现业务增长。
医疗
基于对生物医学行业的关注,火山引擎与行业深度结合,通过BT+IT技术推动行业加速,为客户提供多场景的解决方案,支持客户业务创新、敏捷落地。
政府文旅
基于抖音集团的技术底座,火山引擎整合云基础、数据、人工智能、物联网等技术能力,全面助力城市实现数字化转型,在城市治理、文旅营销等场景中全面实现效率提升。
通信传媒
基于抖音集团在泛资讯、短视频等领域的前沿能力,火山引擎提供了覆盖内容引入、生产、运营、分发、消费的端到端服务能力,打造完善的媒体数智化运营体系。
大消费
基于抖音集团的场景化实践,火山引擎围绕人货场关系,整合云基础、数据、算法、AI、内容等能力,实现从投放到交易的数据化闭环,帮助企业数字化运营效率提升。
优质的服务,全方位的支持 火山引擎坚定进入云市场 我们将始终坚持三个关键的理念 |
||
定制化服务方案 |
全方位业务响应 |
专业化技术支持 |