百度曦灵数字人服务-百度智能云

百度曦灵数字人服务-百度智能云

专用API
【更新时间: 2024.08.22】 百度曦灵数字人服务是一个以数字人为核心的,基于大模型和生成式AI技术,为用户提供数字人克隆和数字人应用的SaaS平台,曦灵数字人对话是基于百度的大模型以及生成式AI技术。
服务星级:2星
⭐ ⭐ 🌟 🌟 🌟 🌟 🌟
浏览次数
13
采购人数
0
试用次数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是百度智能云的百度曦灵数字人服务?

百度曦灵数字人服务是一个以数字人为核心的,基于大模型和生成式AI技术,为用户提供数字人克隆和数字人应用的SaaS平台,曦灵数字人对话是基于百度的大模型以及生成式AI技术,打造的数字人智能体一站式配置和应用。旨在为客户打造高效、自动化的直播环境,以实现极致的开播效率和卓越的带货体验。

什么是百度智能云的百度曦灵数字人服务?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用百度智能云的百度曦灵数字人服务,从而实现程序的自动化交互,提高服务效率。

百度智能云的百度曦灵数字人服务有哪些核心功能?

数字人定制


用户使用曦灵进行了人像克隆和声音克隆后,对应资产会显示在该页面中,支持进行编辑管理。 平台还提供了800+个公共人像和150+个公共音色供用户在直播、视频、对话应用中使用。

直播工作台


为匹配直播客户「先授权-再开播」的使用习惯,支持用户授权美团、快手、抖音、淘宝、京东等多个平台,并支持用户直接在平台中查看自己的直播间数据。

视频工作台


视频工作台包含四种制作视频的方式:裂变视频、精编视频、分身视频、AI卡片,分别适用于不同的制作视频的场景

对话工作台


对话工作台基于百度文心大模型以及生成式AI技术打造,可以一站式配置和应用数字人智能体,为终端用户提供7x24小时的专业服务。

百度智能云的百度曦灵数字人服务的核心优势是什么?

  1. 数字人形象制作方式多样:曦灵数字人支持文生3D数字人,一句话即可创造 3D 形象,所见即所得;曦灵2D 数字人克隆采用最新 AI 算法,人像效果超拟真;上传照片即可进行照片数字人克隆,可用于制作AI 名片、活动电子邀请函等类型的AI卡片

  2. 多样化数字人形象:丰富的公共数字人形象,包括2D和3D多种形象可供选择,搭配数字人克隆,可打造个性化的数字人直播间、数字人视频创作和数字人对话场景。智能化的视频编辑工具,如AI帮写、AI动作等等,可快速制作不同形式的高质量视频内容

  3. 大模型加持助力用户降本提效:通过智能直播间装修、智能话术文案生成、智能弹幕互动,曦灵数字人大幅降低直播间搭建门槛和运营成本,同时提升经营效率;智能化的视频编辑工具,如AI帮写、AI动作等等,可快速制作不同形式的高质量视频内容,工具简单易用化,无需专业的视频编辑技能,让用户更加专注于创意和内容的呈现;基于大模型,三步即可快速配置有知识、有技能、有人格的数字人智能体,通过上传文档构建数字人的专属知识库,让数字人具有通识、行业知识、企业知识的多层知识体系。

     

  4. 多种音色风格:支持将文本转换成富有感染力和真实性的语音,使信息传达更加生动有力。音色克隆让声音更个性更自然更有辨识度。无论是直播带货还是客户服务,有真实感的 TTS 为您的产品增添无尽说服力。

     

  5. 多渲染模式:支持云渲染兼容 WebRTC /RTMP /...等多种通信协议,也支持端渲染,使用自研端渲染引擎适配 H5/Android/iOS 等多终端场景。

     

  6. 海量精美模板:提供丰富的多类型直播间装修、视频制作和数字人对话模板,通过模板快速编辑制作,一键模板开箱即用,为用户提供快速优质的数字人内容制作体验。

在哪些场景会用到百度智能云的百度曦灵数字人服务?

  1. 电商直播:电商企业可以利用曦灵数字人直播解决方案,创建虚拟主播进行24小时不间断直播,提升带货效率。通过AI技术,这些数字人能够与用户进行互动,回答产品相关问题,并促进销售。
  2. 教育培训:教育机构可以使用曦灵数字人视频制作功能,创建虚拟讲师进行课程解说和教学。这种方式不仅可以节省真人讲师的时间成本,还能通过多样化的数字人形象和视频形式,提高学生的学习兴趣和参与度。
  3. 客户服务:企业可以将曦灵数字人对话应用于公众号、小程序、网站等终端场景,提供7x24小时的客户服务。数字人能够回答用户咨询,解决常见问题,提升用户满意度和企业的运营效率。
  4. 品牌营销:品牌可以利用曦灵数字人创建具有品牌特色的虚拟代言人,进行品牌宣传和推广。这些数字人可以在社交媒体、广告视频等多种渠道中展示,增强品牌的记忆点和吸引力。
<
产品价格
>

<
使用指南
>

一、登录曦灵数字人SaaS平台

  1. 支持在未登录状态下浏览部分页面,但浏览更多页面及进行一些页面操作需进行账号登录。
  2. 用户可使用百度账号/百度智能云账号登录。

二、首页功能介绍

  1. 克隆入口模块:点击页面中“2D数字人克隆”可进入2D数字人克隆页;点击“照片数字人克隆”可进入照片数字人克隆页;点击“音色克隆”可进入音色克隆页。
  2. 我的形象&我的音色模块:展示我克隆的2D极速克隆、2D精品克隆和照片克隆的人像;未定制时展示三种示例人像,点击示例人像跳转对应的人像克隆页面。
  3. 我的应用模块:展示数字人直播、数字人视频、数字人对话三个核心功能的相关数据。点击“极速开播”按钮进入直播工作台页面;点击“开始创作”按钮进入视频工作台页面;点击“快速搭建”按钮进入对话工作台页面。

三、数字人管理页

  1. 当用户使用曦灵进行了人像克隆和声音克隆后,对应资产会显示在该页面中,支持用户进行编辑管理。
  2. 平台提供800+个公共人像和150+个公共音色供用户在直播、视频、对话应用中使用。

四、2D数字人克隆

  1. 精品克隆:适用于需要高度还原真人的应用场景,如真人IP短视频生产。训练视频需张口录制,并保留音频,4小时可完成训练。
  2. 极速克隆:适用于追求人像克隆效率的应用场景,如品牌直播。训练视频需闭口录制,无需保留音频,30分钟即可完成训练。

五、照片数字人克隆

  1. 适用于需要大批量生成数字人,但缺乏底板视频拍摄条件的场景。
  2. 通过照片克隆人像进行简单内容播报,如AI名片、保险经纪人应用场景。

六、3D数字人生成

  1. 用户输入一句想要的人像风格的文案,即可自动生成3D数字人。
  2. 适用于打造企业IP、文旅IP、娱乐IP等应用场景。

七、音色克隆

  1. 仅需10s录音,1分钟之内就能生成自己的定制音色。
  2. 用于数字人的播报和内容生产。

八、直播工作台

  1. 支持用户授权多个平台,并直接在平台中查看直播间数据。
  2. 支持选品并一键创建直播间,未授权账号也可使用体验模式。
  3. 直播间编辑界面支持商品的添加、复制、删除等操作,并可调整文案、模板等。
  4. 直播过程中支持真人接管功能。

九、视频工作台

  1. 包含裂变视频、精编视频、分身视频、AI卡片四种制作视频的方式。
  2. 分别适用于不同的视频制作场景,如广告投放、招聘、加盟等。

十、对话工作台

  1. 基于百度文心大模型及生成式AI技术打造,可一站式配置和应用数字人智能体。
  2. 支持构建有知识、有技能、有人格的新一代交互型数字人。
  3. 可将数字人应用在公众号、小程序、网站等多种终端场景,提供7x24小时的专业服务。

详情查看链接:https://cloud.baidu.com/doc/AI_DH_CLOUD/s/Ylx39dvr8

<
产品问答
>
?
2D数字人克隆视频无法上传
请检查:视频尺寸是否为标准的9:16、视频格式是否为mp4、分辨率是否为1080p;如不符合格式邀请,请使用视频处理工具将视频进行调整,将调整后的视频重新上传
?
2D数字人克隆视频上传后人像训练失败
请检查视频素材是否存在脸部被遮挡或大幅度转头情况、检查视频素材前后是否存在黑色画面;存在脸部被遮挡或大幅度转头情况,请重新拍摄,注意不要遮挡脸部,转角不要超过45度;视频素材前后是否存在黑色画面的,可以将黑色部分剪辑掉,再进行训练
?
点击开启直播后,无动态数字人画面
检查google浏览器地址栏右侧是否有拦截弹窗图标,若有图标则点击图标,选择始终允许,刷新后重新开始直播
?
数字人画面卡顿
1、打开任务管理器,点击性能选项,看cpu或内存是否占用率达到90%以上,解决方法:关闭非必要软件,如仍无法解决,需要提升电脑配置,端版本本推荐显卡为3060,内存32g以上;2、检查google浏览器是否开启硬件加速,可点击浏览器设置-系统-开启硬件加速;3、若抖音开播,检查wecam中捕捉的画面帧数是否为25及以上,在wecam中调整捕捉窗口的帧数,至少达到25
?
数字人清晰度低
1、检查显示屏分辨率是否为1080p及以上,如不是,需要调整分辨率为1920×1080或以上;2、数字人在捕捉过程中会有一定的清晰度损失,若差别较小则属于正常现象
?
数字人开播后,平台内“弹”字按钮无法点击,提示未授权
1、检查账号是否已经完成弹幕授权,如未授权弹幕,先进行弹幕授权;2、检查数字人平台右上角授权平台与开播平台是否一致,请调整右上角授权账号与平台一致;3、美团直播需检查直播间id是否正确,美团每场直播id会有变动,需要重新正确填写
?
是否支持克隆音色
可在数字人页面点击音色克隆,通过上传符合要求的音频即可克隆音色
?
是否可以自行配音
支持您上传音频或者使用平台录音驱动数字人适应唇形的。
?
我想定制自己的分身,但没有找到训练入口
当前分身训练,我们会对您的视频拍摄进行1v1指导和审核,如有分身训练需求,请咨询官方助手。
?
是否提供 API 接口
这个需要根据您的详细需求以及使用场景进一步分析,如有问题,可在官网添加百度曦灵数字人官方助手做进一步了解。
<
关于我们
>
北京百度网讯科技有限公司是一家领先的人工智能平台型公司,提供全面的云服务和解决方案。公司依托强大的云计算能力,结合百度大脑和大数据技术,为企业和开发者提供包括云服务器、对象存储、内容分发网络、人工智能、企业服务等在内的多样化产品和服务。通过智能化解决方案,百度智能云助力各行业实现数字化转型和智能化升级,推动产业创新和社会进步。
联系信息
服务时间: 7 * 24
电话号码: 400-920-8999转1
网页在线客服: 咨询

安全合规可信的云服务

<
最可能同场景使用的其他API
>
API接口列表
<
产品价格
>

<
使用指南
>

一、登录曦灵数字人SaaS平台

  1. 支持在未登录状态下浏览部分页面,但浏览更多页面及进行一些页面操作需进行账号登录。
  2. 用户可使用百度账号/百度智能云账号登录。

二、首页功能介绍

  1. 克隆入口模块:点击页面中“2D数字人克隆”可进入2D数字人克隆页;点击“照片数字人克隆”可进入照片数字人克隆页;点击“音色克隆”可进入音色克隆页。
  2. 我的形象&我的音色模块:展示我克隆的2D极速克隆、2D精品克隆和照片克隆的人像;未定制时展示三种示例人像,点击示例人像跳转对应的人像克隆页面。
  3. 我的应用模块:展示数字人直播、数字人视频、数字人对话三个核心功能的相关数据。点击“极速开播”按钮进入直播工作台页面;点击“开始创作”按钮进入视频工作台页面;点击“快速搭建”按钮进入对话工作台页面。

三、数字人管理页

  1. 当用户使用曦灵进行了人像克隆和声音克隆后,对应资产会显示在该页面中,支持用户进行编辑管理。
  2. 平台提供800+个公共人像和150+个公共音色供用户在直播、视频、对话应用中使用。

四、2D数字人克隆

  1. 精品克隆:适用于需要高度还原真人的应用场景,如真人IP短视频生产。训练视频需张口录制,并保留音频,4小时可完成训练。
  2. 极速克隆:适用于追求人像克隆效率的应用场景,如品牌直播。训练视频需闭口录制,无需保留音频,30分钟即可完成训练。

五、照片数字人克隆

  1. 适用于需要大批量生成数字人,但缺乏底板视频拍摄条件的场景。
  2. 通过照片克隆人像进行简单内容播报,如AI名片、保险经纪人应用场景。

六、3D数字人生成

  1. 用户输入一句想要的人像风格的文案,即可自动生成3D数字人。
  2. 适用于打造企业IP、文旅IP、娱乐IP等应用场景。

七、音色克隆

  1. 仅需10s录音,1分钟之内就能生成自己的定制音色。
  2. 用于数字人的播报和内容生产。

八、直播工作台

  1. 支持用户授权多个平台,并直接在平台中查看直播间数据。
  2. 支持选品并一键创建直播间,未授权账号也可使用体验模式。
  3. 直播间编辑界面支持商品的添加、复制、删除等操作,并可调整文案、模板等。
  4. 直播过程中支持真人接管功能。

九、视频工作台

  1. 包含裂变视频、精编视频、分身视频、AI卡片四种制作视频的方式。
  2. 分别适用于不同的视频制作场景,如广告投放、招聘、加盟等。

十、对话工作台

  1. 基于百度文心大模型及生成式AI技术打造,可一站式配置和应用数字人智能体。
  2. 支持构建有知识、有技能、有人格的新一代交互型数字人。
  3. 可将数字人应用在公众号、小程序、网站等多种终端场景,提供7x24小时的专业服务。

详情查看链接:https://cloud.baidu.com/doc/AI_DH_CLOUD/s/Ylx39dvr8

<
依赖服务
>
<
产品问答
>
?
2D数字人克隆视频无法上传
请检查:视频尺寸是否为标准的9:16、视频格式是否为mp4、分辨率是否为1080p;如不符合格式邀请,请使用视频处理工具将视频进行调整,将调整后的视频重新上传
?
2D数字人克隆视频上传后人像训练失败
请检查视频素材是否存在脸部被遮挡或大幅度转头情况、检查视频素材前后是否存在黑色画面;存在脸部被遮挡或大幅度转头情况,请重新拍摄,注意不要遮挡脸部,转角不要超过45度;视频素材前后是否存在黑色画面的,可以将黑色部分剪辑掉,再进行训练
?
点击开启直播后,无动态数字人画面
检查google浏览器地址栏右侧是否有拦截弹窗图标,若有图标则点击图标,选择始终允许,刷新后重新开始直播
?
数字人画面卡顿
1、打开任务管理器,点击性能选项,看cpu或内存是否占用率达到90%以上,解决方法:关闭非必要软件,如仍无法解决,需要提升电脑配置,端版本本推荐显卡为3060,内存32g以上;2、检查google浏览器是否开启硬件加速,可点击浏览器设置-系统-开启硬件加速;3、若抖音开播,检查wecam中捕捉的画面帧数是否为25及以上,在wecam中调整捕捉窗口的帧数,至少达到25
?
数字人清晰度低
1、检查显示屏分辨率是否为1080p及以上,如不是,需要调整分辨率为1920×1080或以上;2、数字人在捕捉过程中会有一定的清晰度损失,若差别较小则属于正常现象
?
数字人开播后,平台内“弹”字按钮无法点击,提示未授权
1、检查账号是否已经完成弹幕授权,如未授权弹幕,先进行弹幕授权;2、检查数字人平台右上角授权平台与开播平台是否一致,请调整右上角授权账号与平台一致;3、美团直播需检查直播间id是否正确,美团每场直播id会有变动,需要重新正确填写
?
是否支持克隆音色
可在数字人页面点击音色克隆,通过上传符合要求的音频即可克隆音色
?
是否可以自行配音
支持您上传音频或者使用平台录音驱动数字人适应唇形的。
?
我想定制自己的分身,但没有找到训练入口
当前分身训练,我们会对您的视频拍摄进行1v1指导和审核,如有分身训练需求,请咨询官方助手。
?
是否提供 API 接口
这个需要根据您的详细需求以及使用场景进一步分析,如有问题,可在官网添加百度曦灵数字人官方助手做进一步了解。
<
关于我们
>
北京百度网讯科技有限公司是一家领先的人工智能平台型公司,提供全面的云服务和解决方案。公司依托强大的云计算能力,结合百度大脑和大数据技术,为企业和开发者提供包括云服务器、对象存储、内容分发网络、人工智能、企业服务等在内的多样化产品和服务。通过智能化解决方案,百度智能云助力各行业实现数字化转型和智能化升级,推动产业创新和社会进步。
联系信息
服务时间: 7 * 24
电话号码: 400-920-8999转1
网页在线客服: 咨询

安全合规可信的云服务

<
合作案例
>

寿光蔬菜

 

泰康人寿

 

国家电网 国网新疆电力公司

 

常熟经济技术开发区

 

火星人集成灶

 

宝钢集团

 

BAOWU

 

源创电喷

 

恒逸

 

中国建材集团有限公司

 

国家电网湖南电力公司

 

 

重庆两江新区 三一重工 徐州工业
<
最可能同场景使用的其他API
>