虚拟数字人-阿里云视觉智能开发平台

虚拟数字人-阿里云视觉智能开发平台

专用API
【更新时间: 2024.07.15】 虚拟数字人技术以AI实时渲染为核心,快速构建轻量级数字人物。依托达摩院在语音、图像、3D美术、NLP等领域的技术,提供实时交互的数字人流媒体产品、高效的视频合成服务,以及定制化的数字人资产构建。
5749元/路/月 去服务商官网采购>
服务星级:2星
⭐ ⭐ 🌟 🌟 🌟 🌟 🌟
浏览次数
49
采购人数
0
试用次数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是阿里云视觉智能开发平台的虚拟数字人?

虚拟数字人以AI驱动实时渲染为核心能力,提供快速轻量的数字人构建路径。基于达摩院在语音、图像、3D美术、自然语言处理等领域的技术优势,提供以实时交互为目标的「数字人流媒体」产品、以效率化内容生产为目标的「数字人视频合成」产品,以及丰富表现力的数字人资产构建定制服务。现在购买,畅享数字人带来的无限可能!

什么是阿里云视觉智能开发平台的虚拟数字人接口?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用阿里云视觉智能开发平台的虚拟数字人,从而实现程序的自动化交互,提高服务效率。

阿里云视觉智能开发平台的虚拟数字人有哪些核心功能?

  1. 数字人流媒体:阿里数字人提供数字人标准化PaaS服务,可集成到各种终端上。通过阿里云虚拟数字人的PaaS接口传递数字人即将播报的文本,可以获得数字人播报的视频流或离线视频文件。支持在线直播、数字人助理播报等效果,并且可以集成在Web、移动端、PC端、线下大屏等各种类型终端上
  2. 数字人视频合成:阿里数字人提供离线驱动3D/2D数字人进行文本播报生成对应视频的产品能力。支持通过API以及SaaS页面两种方式向服务端发送文本,服务端接收到数据后处理成数字人的声音、表情、口型、动作,然后将对应数据合成指定格式的视频,并提供对应的视频下载地址
  3. 数字人资产库:阿里数字人提供3D/2D数字人形象的预览、捏脸、换装、声音切换等编辑管理能力。官方提供了丰富的3D数字人和2D数字人形象,并支持对官方形象进行预览和编辑,如换装以及声音切换等(2D数字人形象暂不支持编辑)
  4. 语音、视觉多模态表达:集成自然语言理解算法,根据播报的内容智能驱动数字人表情和动作,实现语音、表情、手势动作的多模态表达
  5. 虚拟数字人视频创作:基于数字人开放平台的技术能力,提供预置的3D虚拟数字人形象,并支持文本输入生成数字人视频,支持更换背景、设置字幕、自定义数字人音色、形象,可快速生成视频,进行下一步的自由创作或者直接投放
  6. 自主灵活配置多种素材:支持驱动人物表情与动作,基于表情驱动及动作驱动的数字人技术,生成的数字人形象可以根据播报的内容,零延迟匹配对应的唇形。同时,根据文本的语义分析,配以对应的手势动作,使数字人播报更加流畅自然,富有感染力

阿里云视觉智能开发平台的虚拟数字人的核心优势是什么?

  1. 强大的AI技术能力:阿里数字人依托阿里达摩院在语音、图像、3D美术、自然语言处理(NLP)等领域的技术优势,阿里虚拟数字人服务能够提供高度智能化的实时渲染和驱动能力,使得数字人的表现更加自然、生动。

  2. 多模态交互能力:阿里数字人通过集成CV(计算机视觉)、3D、语音、NLP以及包含知识、情感、记忆、个性的对话大模型等多模态技术,阿里虚拟数字人能够实现情感化的双工交互,即能够理解和响应用户的情绪,并据此进行更加自然和人性化的互动,提升用户体验。

  3. 高效的构建与定制服务:阿里数字人提供低门槛、轻量级、易集成的数字人构建路径,无论是3D数字人还是2D数字人,都能快速构建并接入到客户的业务中。同时,提供丰富的数字人资产形象库和完善的视频创作SAAS产品,满足不同客户的个性化需求。

  4. 广泛的应用场景:阿里数字人支持视频合成、流媒体实时交互、数字造星等多种应用场景。用户可以根据需求选择不同风格的数字人、音色、背景等,生成适用于教育、电商、新闻、视频客服、助理、直播等多种场景的数字人播报视频或实时交互内容。

  5. 灵活的技术底座与扩展性:阿里数字人提供基于AI驱动的数字人实时渲染推流的PaaS技术底座,支持客户根据自身业务需求开发应用,并具备未来推出更多驱动模式的能力,确保了服务的灵活性和可扩展性。

在哪些场景会用到阿里云视觉智能开发平台的虚拟数字人?

1.内容创作

阿里数字人可应用于新闻播报、政策解读、课件讲解将文本、语音等内容转化为以数字人形象为主的视频内容,使其能够满足在电视、网站、视频平台或社交平台等视听媒体的投放或传播需求。阿里数字人为内容创作者提供更低门槛、更强表现力的视频内容创作工具,提升创作效率,放大内容价值。

2.数字员工

您的专属数字员工支持数字人形象与智能助理场景结合,将传统文本互动升级为数字人交互,打造同时具备亲切感与专业度的数字员工形象。应用数字员工,可替代真人完成基本的业务咨询答疑、信息播报、数据查询、业务流程办理等服务。阿里数字人可以与观众进行双向互动和实时反馈,提高观众的参与度和兴趣度,相较于单向传播的真人直播,虚拟直播的互动性更强,提升了用户体验

3.视频客服

我们的功能优势通过赋予客服机器人阿里数字人的形象,将传统的在线/热线客服升级成为支持WebRTC或VoLTE视频客服。支持个性化配置客服形象和声音,让AI服务过程更亲切、更有温度;支持文本+语音+视频双向交互,并且可以根据用户的表情、动作和环境信息定制服务响应策略。虚拟数字人克隆技术可以实现多元化的形象定制,只需拍摄几分钟的真人视频,上传至克隆平台,通过AI深度建模,完美复刻真人形象,适用于多种场景

 

4.虚拟直播

阿里数字人能够实现全天候不间断的直播,无需真人主播,节省了真人直播所需的休息时间和流量空档期,使品牌能够在全时段得到曝光,更好地获取流量。相比于真人直播的高昂成本,包括聘请主播、场地租赁、设备配置等,虚拟数字人直播无需这些开销,只需一部手机或电脑即可搭建直播间,且可快速复制,极大降低了成本

<
产品价格
>

3D数字人流媒体

目前包含预付费、按量计费两种模式:

预付费模式

规格名称

价格

3D数字人流媒体

5749元/路/月

说明

5749元/路/月,这里的路指的是并发路数,也就是同一时刻支持几个用户与数字人进行交互,1路并发就是支持同一时刻只有1个用户与数字人进行交互。3D数字人流媒体(停复机)的路数同理。

按量计费模式

规格名称

价格

3D数字人流媒体(停复机)

0.60元/路/分钟

数字人视频合成

目前包含按量计费和预付费流量包两种模式:

按量计费模式

规格名称

价格

数字人视频合成

9.9元/分钟(计费精确到秒,相当于0.165元/秒)

预付费流量包(100分钟以上)

如您对视频合成用量较大(100分钟以上),可根据实际需求购买视频合成预付费流量包,在使用视频合成创作时,会优先抵扣资源包中的流量,超出资源包的流量再按量计费。点此购买

2D真人形象定制

目前包含按量计费一种模式:

按量计费模式

规格名称

价格

2D真人形象定制(不支持退款)

6999元/每个形象/年(第二年使用需续费,续费价格请联系工作人员)

说明
  • 上传5-10分钟拍摄视频后,除去用户确认时间,算法训练最长10个工作日处理完成;

  • 人工审核通过后,将会发送短信通知您,您需前往控制台进行确认训练,确认后将自动扣费,不支持退款;

<
使用指南
>

1. 接入流程

  1. 申请阿里云账号,完成实名认证(个人或企业均可)

  2. 申请购买权限,完成购买开通服务

  3. 配置应用

  4. 服务端接入

  5. 客户端接入

2. 申请账号

  • 您需要提前申请好一个阿里云账号,并完成实名认证,具体操作方式可参考准备工作

3. 申请购买

  • 拥有了阿里云账号之后,您需要通过虚拟数字人开放平台的申请审核,然后才能进行购买,具体操作方式可参考开通服务

4. 配置应用

5. 服务端接入

  • 虚拟数字人开放平台服务端接入依赖OpenAPI

  • 在调用OpenAPI之前需要拿到API调用所需要的AK和SK, 获取方式可参考获取AccessKey文档

  • 详细的服务端接入文档可参考服务端 API 接入篇

6. 客户端接入

  • 客户端接入,主要解决的是视频流拉取的问题,采用阿里云音视频RTC的技术方案,提供了丰富的客户端接入能力

  • 详细的客户端接入文档可参考3D数字人实时流媒体

7. 客户端硬件要求

  • 1路并发的带宽要求:

类别

要求

备注

下行速率

2Mb/s

720P/路,仅考虑RTC拉流,不包含应用中数字人以外其他功能所占带宽

上行速率

1Mb/s

仅考虑音频互动通道

指南详情链接:https://help.aliyun.com/zh/avatar/avatar/getting-started/integrate-dvh-open-platform?spm=5176.23370677.J_7001639620.3.43515917lQi2AU
<
产品问答
>
?
是否支持测试体验?
针对3D阿里数字人流媒体产品,用户可以通过下单3D阿里数字人流媒体(停复机)商品进行测试体验。该商品属于后付费商品,下单时不需要付费,使用时才需付费。用户可以在项目管理中创建App关联该实例进行测试预览
?
3D数字人形象是否可以定制?
目前不支持3D数字人定制以及导入功能
?
数字人交互时表情是否根据内容自动生成?
在数字人流媒体服务中,表情是根据文本内容自动生成的,无需额外配置
?
阿里数字人流媒体服务的拟真人渲染效果如何?
阿里数字人流媒体服务可以达到市面上主流的拟真人渲染效果
?
是否支持其他对话机器人引擎?
互动数字人目前只支持云小蜜,可以通过播报数字人结合ASR、其他对话机器人
?
接入开放平台生成类似真人的数字人与卡通类型的数字人,两者的接入和开发成本区别大吗?
接入部分的工作量没有区别
?
产品是否可以私有化部署?视频流是否有加密?
阿里数字人产品不支持私有化部署,视频流不支持不走公网
?
播报数字人如何做打断?
可以通过设置API SendMessage请求参数内"TextRequest.interrupt"为true来实现打断
<
关于我们
>
阿里云计算有限公司,成立于2009年,是全球领先的云计算及人工智能技术服务提供商。作为阿里巴巴集团的云服务部门,阿里云致力于通过先进的云计算技术,为全球企业、开发者和政府机构提供安全、稳定、可靠的云服务。公司服务覆盖计算、存储、数据库、网络、大数据、人工智能等多个领域,拥有遍布全球的数据中心和强大的技术实力,支持企业数字化转型和创新。
联系信息
服务时间: 0:00 - 24:00
电话号码: 86 571 8502 2600
网页在线客服: 咨询
AI时代,领先企业的共同选择
阿里云以全球云基础设施、超大规模普惠算力、先进AI技术体系助力企业开启AI时代的领先之路,一起乘云而上!
阿里云,数字经济的技术基础设施
云计算是一场伟大的变革,让计算成为公共服务,提供随时随地可用的算力。在数字经济大潮下,云计算是数据的基础,价值在于让客户有了数据处理的可能,而不只是IDC搬迁带来的成本节约。
 
01为千行百业创新提速
为300万企业和组织发展提速,助力数字经济和产业加速融合
 
02开发者首选创新加速器
阿里云以普惠算力和丰富的技术产品,服务1000万开发者
 
03为社会创造美好生活
阿里云持续践行绿色、公益、普惠,用科技服务社会大众
 
企业社会责任,绿色、可持续
呼吁全球的创新者,用技术做有情有义的事,为世界带来有益改变,更能帮助解决人类面临的贫困、教育、环境等问题。
<
最可能同场景使用的其他API
>
API接口列表
<
产品价格
>

3D数字人流媒体

目前包含预付费、按量计费两种模式:

预付费模式

规格名称

价格

3D数字人流媒体

5749元/路/月

说明

5749元/路/月,这里的路指的是并发路数,也就是同一时刻支持几个用户与数字人进行交互,1路并发就是支持同一时刻只有1个用户与数字人进行交互。3D数字人流媒体(停复机)的路数同理。

按量计费模式

规格名称

价格

3D数字人流媒体(停复机)

0.60元/路/分钟

数字人视频合成

目前包含按量计费和预付费流量包两种模式:

按量计费模式

规格名称

价格

数字人视频合成

9.9元/分钟(计费精确到秒,相当于0.165元/秒)

预付费流量包(100分钟以上)

如您对视频合成用量较大(100分钟以上),可根据实际需求购买视频合成预付费流量包,在使用视频合成创作时,会优先抵扣资源包中的流量,超出资源包的流量再按量计费。点此购买

2D真人形象定制

目前包含按量计费一种模式:

按量计费模式

规格名称

价格

2D真人形象定制(不支持退款)

6999元/每个形象/年(第二年使用需续费,续费价格请联系工作人员)

说明
  • 上传5-10分钟拍摄视频后,除去用户确认时间,算法训练最长10个工作日处理完成;

  • 人工审核通过后,将会发送短信通知您,您需前往控制台进行确认训练,确认后将自动扣费,不支持退款;

<
使用指南
>

1. 接入流程

  1. 申请阿里云账号,完成实名认证(个人或企业均可)

  2. 申请购买权限,完成购买开通服务

  3. 配置应用

  4. 服务端接入

  5. 客户端接入

2. 申请账号

  • 您需要提前申请好一个阿里云账号,并完成实名认证,具体操作方式可参考准备工作

3. 申请购买

  • 拥有了阿里云账号之后,您需要通过虚拟数字人开放平台的申请审核,然后才能进行购买,具体操作方式可参考开通服务

4. 配置应用

5. 服务端接入

  • 虚拟数字人开放平台服务端接入依赖OpenAPI

  • 在调用OpenAPI之前需要拿到API调用所需要的AK和SK, 获取方式可参考获取AccessKey文档

  • 详细的服务端接入文档可参考服务端 API 接入篇

6. 客户端接入

  • 客户端接入,主要解决的是视频流拉取的问题,采用阿里云音视频RTC的技术方案,提供了丰富的客户端接入能力

  • 详细的客户端接入文档可参考3D数字人实时流媒体

7. 客户端硬件要求

  • 1路并发的带宽要求:

类别

要求

备注

下行速率

2Mb/s

720P/路,仅考虑RTC拉流,不包含应用中数字人以外其他功能所占带宽

上行速率

1Mb/s

仅考虑音频互动通道

指南详情链接:https://help.aliyun.com/zh/avatar/avatar/getting-started/integrate-dvh-open-platform?spm=5176.23370677.J_7001639620.3.43515917lQi2AU
<
依赖服务
>
<
产品问答
>
?
是否支持测试体验?
针对3D阿里数字人流媒体产品,用户可以通过下单3D阿里数字人流媒体(停复机)商品进行测试体验。该商品属于后付费商品,下单时不需要付费,使用时才需付费。用户可以在项目管理中创建App关联该实例进行测试预览
?
3D数字人形象是否可以定制?
目前不支持3D数字人定制以及导入功能
?
数字人交互时表情是否根据内容自动生成?
在数字人流媒体服务中,表情是根据文本内容自动生成的,无需额外配置
?
阿里数字人流媒体服务的拟真人渲染效果如何?
阿里数字人流媒体服务可以达到市面上主流的拟真人渲染效果
?
是否支持其他对话机器人引擎?
互动数字人目前只支持云小蜜,可以通过播报数字人结合ASR、其他对话机器人
?
接入开放平台生成类似真人的数字人与卡通类型的数字人,两者的接入和开发成本区别大吗?
接入部分的工作量没有区别
?
产品是否可以私有化部署?视频流是否有加密?
阿里数字人产品不支持私有化部署,视频流不支持不走公网
?
播报数字人如何做打断?
可以通过设置API SendMessage请求参数内"TextRequest.interrupt"为true来实现打断
<
关于我们
>
阿里云计算有限公司,成立于2009年,是全球领先的云计算及人工智能技术服务提供商。作为阿里巴巴集团的云服务部门,阿里云致力于通过先进的云计算技术,为全球企业、开发者和政府机构提供安全、稳定、可靠的云服务。公司服务覆盖计算、存储、数据库、网络、大数据、人工智能等多个领域,拥有遍布全球的数据中心和强大的技术实力,支持企业数字化转型和创新。
联系信息
服务时间: 0:00 - 24:00
电话号码: 86 571 8502 2600
网页在线客服: 咨询
AI时代,领先企业的共同选择
阿里云以全球云基础设施、超大规模普惠算力、先进AI技术体系助力企业开启AI时代的领先之路,一起乘云而上!
阿里云,数字经济的技术基础设施
云计算是一场伟大的变革,让计算成为公共服务,提供随时随地可用的算力。在数字经济大潮下,云计算是数据的基础,价值在于让客户有了数据处理的可能,而不只是IDC搬迁带来的成本节约。
 
01为千行百业创新提速
为300万企业和组织发展提速,助力数字经济和产业加速融合
 
02开发者首选创新加速器
阿里云以普惠算力和丰富的技术产品,服务1000万开发者
 
03为社会创造美好生活
阿里云持续践行绿色、公益、普惠,用科技服务社会大众
 
企业社会责任,绿色、可持续
呼吁全球的创新者,用技术做有情有义的事,为世界带来有益改变,更能帮助解决人类面临的贫困、教育、环境等问题。
<
最可能同场景使用的其他API
>