虚拟数字人-阿里云视觉智能开发平台
专用API
服务商:
阿里云计算有限公司
【更新时间: 2024.07.15】
虚拟数字人技术以AI实时渲染为核心,快速构建轻量级数字人物。依托达摩院在语音、图像、3D美术、NLP等领域的技术,提供实时交互的数字人流媒体产品、高效的视频合成服务,以及定制化的数字人资产构建。
5749元/路/月
去服务商官网采购>
|
服务星级:2星
浏览次数
49
采购人数
0
试用次数
0
SLA: N/A
响应: N/A
适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
|
- API详情
- 定价
- 使用指南
- 常见 FAQ
- 关于我们
- 相关推荐
什么是阿里云视觉智能开发平台的虚拟数字人?
虚拟数字人以AI驱动实时渲染为核心能力,提供快速轻量的数字人构建路径。基于达摩院在语音、图像、3D美术、自然语言处理等领域的技术优势,提供以实时交互为目标的「数字人流媒体」产品、以效率化内容生产为目标的「数字人视频合成」产品,以及丰富表现力的数字人资产构建定制服务。现在购买,畅享数字人带来的无限可能!
什么是阿里云视觉智能开发平台的虚拟数字人接口?
阿里云视觉智能开发平台的虚拟数字人有哪些核心功能?
- 数字人流媒体:阿里数字人提供数字人标准化PaaS服务,可集成到各种终端上。通过阿里云虚拟数字人的PaaS接口传递数字人即将播报的文本,可以获得数字人播报的视频流或离线视频文件。支持在线直播、数字人助理播报等效果,并且可以集成在Web、移动端、PC端、线下大屏等各种类型终端上。
- 数字人视频合成:阿里数字人提供离线驱动3D/2D数字人进行文本播报生成对应视频的产品能力。支持通过API以及SaaS页面两种方式向服务端发送文本,服务端接收到数据后处理成数字人的声音、表情、口型、动作,然后将对应数据合成指定格式的视频,并提供对应的视频下载地址。
- 数字人资产库:阿里数字人提供3D/2D数字人形象的预览、捏脸、换装、声音切换等编辑管理能力。官方提供了丰富的3D数字人和2D数字人形象,并支持对官方形象进行预览和编辑,如换装以及声音切换等(2D数字人形象暂不支持编辑)。
- 语音、视觉多模态表达:集成自然语言理解算法,根据播报的内容智能驱动数字人表情和动作,实现语音、表情、手势动作的多模态表达。
- 虚拟数字人视频创作:基于数字人开放平台的技术能力,提供预置的3D虚拟数字人形象,并支持文本输入生成数字人视频,支持更换背景、设置字幕、自定义数字人音色、形象,可快速生成视频,进行下一步的自由创作或者直接投放。
- 自主灵活配置多种素材:支持驱动人物表情与动作,基于表情驱动及动作驱动的数字人技术,生成的数字人形象可以根据播报的内容,零延迟匹配对应的唇形。同时,根据文本的语义分析,配以对应的手势动作,使数字人播报更加流畅自然,富有感染力
阿里云视觉智能开发平台的虚拟数字人的核心优势是什么?
-
强大的AI技术能力:阿里数字人依托阿里达摩院在语音、图像、3D美术、自然语言处理(NLP)等领域的技术优势,阿里虚拟数字人服务能够提供高度智能化的实时渲染和驱动能力,使得数字人的表现更加自然、生动。
-
多模态交互能力:阿里数字人通过集成CV(计算机视觉)、3D、语音、NLP以及包含知识、情感、记忆、个性的对话大模型等多模态技术,阿里虚拟数字人能够实现情感化的双工交互,即能够理解和响应用户的情绪,并据此进行更加自然和人性化的互动,提升用户体验。
-
高效的构建与定制服务:阿里数字人提供低门槛、轻量级、易集成的数字人构建路径,无论是3D数字人还是2D数字人,都能快速构建并接入到客户的业务中。同时,提供丰富的数字人资产形象库和完善的视频创作SAAS产品,满足不同客户的个性化需求。
-
广泛的应用场景:阿里数字人支持视频合成、流媒体实时交互、数字造星等多种应用场景。用户可以根据需求选择不同风格的数字人、音色、背景等,生成适用于教育、电商、新闻、视频客服、助理、直播等多种场景的数字人播报视频或实时交互内容。
-
灵活的技术底座与扩展性:阿里数字人提供基于AI驱动的数字人实时渲染推流的PaaS技术底座,支持客户根据自身业务需求开发应用,并具备未来推出更多驱动模式的能力,确保了服务的灵活性和可扩展性。
在哪些场景会用到阿里云视觉智能开发平台的虚拟数字人?
1.内容创作
阿里数字人可应用于新闻播报、政策解读、课件讲解将文本、语音等内容转化为以数字人形象为主的视频内容,使其能够满足在电视、网站、视频平台或社交平台等视听媒体的投放或传播需求。阿里数字人为内容创作者提供更低门槛、更强表现力的视频内容创作工具,提升创作效率,放大内容价值。
2.数字员工
您的专属数字员工支持数字人形象与智能助理场景结合,将传统文本互动升级为数字人交互,打造同时具备亲切感与专业度的数字员工形象。应用数字员工,可替代真人完成基本的业务咨询答疑、信息播报、数据查询、业务流程办理等服务。阿里数字人可以与观众进行双向互动和实时反馈,提高观众的参与度和兴趣度,相较于单向传播的真人直播,虚拟直播的互动性更强,提升了用户体验
3.视频客服
我们的功能优势通过赋予客服机器人阿里数字人的形象,将传统的在线/热线客服升级成为支持WebRTC或VoLTE视频客服。支持个性化配置客服形象和声音,让AI服务过程更亲切、更有温度;支持文本+语音+视频双向交互,并且可以根据用户的表情、动作和环境信息定制服务响应策略。虚拟数字人克隆技术可以实现多元化的形象定制,只需拍摄几分钟的真人视频,上传至克隆平台,通过AI深度建模,完美复刻真人形象,适用于多种场景
4.虚拟直播
阿里数字人能够实现全天候不间断的直播,无需真人主播,节省了真人直播所需的休息时间和流量空档期,使品牌能够在全时段得到曝光,更好地获取流量。相比于真人直播的高昂成本,包括聘请主播、场地租赁、设备配置等,虚拟数字人直播无需这些开销,只需一部手机或电脑即可搭建直播间,且可快速复制,极大降低了成本
3D数字人流媒体
目前包含预付费、按量计费两种模式:
预付费模式
规格名称 |
价格 |
3D数字人流媒体 |
5749元/路/月 |
按量计费模式
规格名称 |
价格 |
3D数字人流媒体(停复机) |
0.60元/路/分钟 |
数字人视频合成
目前包含按量计费和预付费流量包两种模式:
按量计费模式
规格名称 |
价格 |
数字人视频合成 |
9.9元/分钟(计费精确到秒,相当于0.165元/秒) |
预付费流量包(100分钟以上)
如您对视频合成用量较大(100分钟以上),可根据实际需求购买视频合成预付费流量包,在使用视频合成创作时,会优先抵扣资源包中的流量,超出资源包的流量再按量计费。点此购买
2D真人形象定制
目前包含按量计费一种模式:
按量计费模式
规格名称 |
价格 |
2D真人形象定制(不支持退款) |
6999元/每个形象/年(第二年使用需续费,续费价格请联系工作人员) |
1. 接入流程
-
申请阿里云账号,完成实名认证(个人或企业均可)
-
申请购买权限,完成购买开通服务
-
配置应用
-
服务端接入
-
客户端接入
2. 申请账号
-
您需要提前申请好一个阿里云账号,并完成实名认证,具体操作方式可参考准备工作。
3. 申请购买
-
拥有了阿里云账号之后,您需要通过虚拟数字人开放平台的申请审核,然后才能进行购买,具体操作方式可参考开通服务。
4. 配置应用
-
服务开通之后,可通过虚拟数字人开放平台控制台入口进行登录访问,创建并配置对应的应用,具体可参考创建并配置数字人应用。
5. 服务端接入
-
虚拟数字人开放平台服务端接入依赖OpenAPI
-
在调用OpenAPI之前需要拿到API调用所需要的AK和SK, 获取方式可参考获取AccessKey文档
-
详细的服务端接入文档可参考服务端 API 接入篇
6. 客户端接入
-
客户端接入,主要解决的是视频流拉取的问题,采用阿里云音视频RTC的技术方案,提供了丰富的客户端接入能力
-
详细的客户端接入文档可参考3D数字人实时流媒体
7. 客户端硬件要求
-
1路并发的带宽要求:
类别 |
要求 |
备注 |
下行速率 |
2Mb/s |
720P/路,仅考虑RTC拉流,不包含应用中数字人以外其他功能所占带宽 |
上行速率 |
1Mb/s |
仅考虑音频互动通道 |
3D数字人流媒体
目前包含预付费、按量计费两种模式:
预付费模式
规格名称 |
价格 |
3D数字人流媒体 |
5749元/路/月 |
按量计费模式
规格名称 |
价格 |
3D数字人流媒体(停复机) |
0.60元/路/分钟 |
数字人视频合成
目前包含按量计费和预付费流量包两种模式:
按量计费模式
规格名称 |
价格 |
数字人视频合成 |
9.9元/分钟(计费精确到秒,相当于0.165元/秒) |
预付费流量包(100分钟以上)
如您对视频合成用量较大(100分钟以上),可根据实际需求购买视频合成预付费流量包,在使用视频合成创作时,会优先抵扣资源包中的流量,超出资源包的流量再按量计费。点此购买
2D真人形象定制
目前包含按量计费一种模式:
按量计费模式
规格名称 |
价格 |
2D真人形象定制(不支持退款) |
6999元/每个形象/年(第二年使用需续费,续费价格请联系工作人员) |
1. 接入流程
-
申请阿里云账号,完成实名认证(个人或企业均可)
-
申请购买权限,完成购买开通服务
-
配置应用
-
服务端接入
-
客户端接入
2. 申请账号
-
您需要提前申请好一个阿里云账号,并完成实名认证,具体操作方式可参考准备工作。
3. 申请购买
-
拥有了阿里云账号之后,您需要通过虚拟数字人开放平台的申请审核,然后才能进行购买,具体操作方式可参考开通服务。
4. 配置应用
-
服务开通之后,可通过虚拟数字人开放平台控制台入口进行登录访问,创建并配置对应的应用,具体可参考创建并配置数字人应用。
5. 服务端接入
-
虚拟数字人开放平台服务端接入依赖OpenAPI
-
在调用OpenAPI之前需要拿到API调用所需要的AK和SK, 获取方式可参考获取AccessKey文档
-
详细的服务端接入文档可参考服务端 API 接入篇
6. 客户端接入
-
客户端接入,主要解决的是视频流拉取的问题,采用阿里云音视频RTC的技术方案,提供了丰富的客户端接入能力
-
详细的客户端接入文档可参考3D数字人实时流媒体
7. 客户端硬件要求
-
1路并发的带宽要求:
类别 |
要求 |
备注 |
下行速率 |
2Mb/s |
720P/路,仅考虑RTC拉流,不包含应用中数字人以外其他功能所占带宽 |
上行速率 |
1Mb/s |
仅考虑音频互动通道 |