智能数智人-腾讯云

智能数智人-腾讯云

专用API
【更新时间: 2024.07.15】 腾讯云智能数智人(Tencent Cloud AI Digital Human)为新一代多模态人机交互系统,快捷打造有智能、有形象、可交互的“数智分身”,引领企业服务智慧升级,助力数智化转型,提升企业沟通效率和服务温度。
服务星级:6星
⭐ ⭐ ⭐ ⭐ ⭐ ⭐ 🌟
调用次数
0
集成人数
0
商用人数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是腾讯云的智能数智人?

腾讯云智能数智人(Tencent Cloud AI Digital Human)为新一代多模态人机交互系统,快捷打造有智能、有形象、可交互的“数智分身”,引领企业服务智慧升级,助力数智化转型,提升企业沟通效率和服务温度。

什么是腾讯云的智能数智人?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用腾讯云的智能数智人,从而实现程序的自动化交互,提高服务效率。

腾讯云的智能数智人有哪些核心功能?

1.  形象生产

 √  多种形象任君挑选,同时支持形象定制
 √  部分形象可以选择展示姿态
 √  部分形象提供多套服装造型选择
 √  支持对声音进行语速和音色的调整

 

2. 交互会话
 √  唇形语音同步,表情动作拟人
 √  支持声音驱动和文本驱动
 √  支持指定文本插入动作,灵活性高
 √  落地场景丰富,落地终端多样

 

3. 音视频播报

 √  唇形动作与声音实时同步
√  支持多种手势动作,自然生动
√  小样本数智人制作成本低,时效快
√  应用场景广泛,提升企业沟通效率和服务温度

腾讯云的智能数智人的技术原理是什么?

腾讯云的智能数智人的核心优势是什么?

形象自然度业界领先

5种形象类型

5种形象类型:2D精品、2D小样本、3D写实、3D半写实、3D卡通

我们的模式
  • √   效果逼真:唇形、表情、姿态、动作拟人度高
  • √   定制高效:具有2D形象制作管线,支持摄影棚录制训练、3分钟视频训练、换√   脸定制;3D形象制作管线支持照片建模
  • √   IP授权:可提供腾讯优势IP形象授权

覆盖企业服务全周期

4类企业服务模块

4类企业服务版块:业务办理、用户运营、营销获客、品牌宣传

我们的优势
  • √   落地规模:业务办理规模市场第一
  • √   行业案例:覆盖银行、证券、保险、教育、政务、传媒、文旅、运营商、交通出行等多个行业
  • √   业务场景:业务场景丰富,数据积累量大

驱动技术业界领先

3种驱动方式

3种驱动方式:文本驱动、声音驱动、单目摄像头驱动

我们的能力
  • √   音色种类丰富:支持60+多情感音色,支持多语种,多方言
  • √   音色自然度高:MOS评分高,无延迟感,真实度高,语音质量好

交互体验佳

2种交互类型

2种交互类型:播报、交互

我们的能力
  • √   时延低:首帧延迟<600ms,POC多次获得第一名
  • √   服务器并发高、服务器性能优越、软硬件配置规格高
  • √   多模交互能力全:NLP、知识图谱、视觉等多种AI技术综合运用,加深感知理解

场景应用拓展性强

1站式数智人平台

1站式应用平台:支持数智人运营管理全流程服务

我们的能力
  • √   接入方式:H5 / 小程序 / Android / iOS
  • √   渲染引擎:Webgl / Unity / UE
  • √   通信协议:支持RTSP / WebRTC / TRTC等多种通信协议

在哪些场景会用到腾讯云的智能数智人?

1. 营销获客

线上营销场景下,数智导购可在虚拟空间进行新产品推介、产品咨询问答,提升线上营销难沟通时效,解决实体门店/营业厅获客成本高的问题

目标客户

•线下服务大厅:如政务、银行等具备实体服务大厅,可升级为虚拟空间服务大厅

•会展策划商:将线下策展升级为线上虚拟空间观展

•商场、酒店、房地产:提供虚拟空间购物、房型展示等

•品牌商宣传部门:打造品牌虚拟空间,拓展营销获客、构建品牌思域流量

客户价值

•品牌增效:打破线下的物理局限性,打造品牌自主IP。助力品牌在“元宇宙”场景的宣发

•创建新玩法:虚拟场景拉通全渠道内容,让用户沉浸式体验品牌内容,提高忠诚度

•迎合新趋势:品牌宣传降本,游戏式互动营销可使公域流量运营提效5-10倍,让品牌宣传更自由,更科幻,对比线下活动更经济,更有趣

 

2. 用户运营

打造数智人IP形象,在相对正式的宣传片中,批量合成宣传、讲解视频

目标客户

•泛政行业-党建、宣传职能部门:塑造城市/委办局代言人,有大量的宣讲视频制作场景

•文旅行业-文旅局、文旅企业、会展商:塑造文化、历史IP形象,用于文化宣传、大会主持、串场等

•教育行业-校园、教育机构:塑造名师形象,用于宣传、课件制作

客户价值

•打造专属IP/代言人:可使用数智人打造城市名片/代言人来提升品牌效应,形象化的角色更能让民众记住,利于未来的宣传

•简化视频制作流程:随时可支持新闻、资讯、宣讲等场景的播报服务,大幅缩减视频制作周期,减少人工、场地等支出

 

3. 业务办理

打造企业统一形象客服,降低员工培训的成本,提升企业品牌专业度

目标客户

•银行: 可应用于信贷审核、面签、信用卡开卡等业务环节

•证券: 可应用于证券开户、VTM机等业务环节

•保险 : 保险代理人线上业务办理等环节

客户价值

•提升业务服务效率:人机协同服务客户业务办理,提高办理成功率

•降低人力成本:数字员工审核较人工审核成本降低60%

优化用户体验:7*24h在线服务,为用户节约审核排队时间

 

4. 品牌宣传

企业通过打造自有IP,增强品牌记忆点,同时用于直播、在线客服等多业务场景,提升用户品牌忠诚度

目标客户

•零售行业品牌部:打造自由品牌代言人,常态化应用于新品发布等宣发场景

•文旅行业:打造景区代言人,同时可为游客提供智能化线上线下导览服务

•金融行业:建设明星数智员工,提升用户对企业品牌认知,形成差异化优势

客户价值

•品牌增效:打造品牌IP虚拟人,增强品牌记忆点,打造品牌效应

•引领趋势:优先运用数字内容营销新技术,抢占商机

•经营降本:建设IP,节省明星代言费用,有效规避明星“塌房”风险

<
产品价格
>

<
使用指南
>

形象采购

形象采购是指数智人的形象购买,具体可以分为形象租赁和形象定制两种方式。此外还可以支持对声音的复刻。
形象租赁:通过租赁公共基础形象库内的形象。租赁期间,为无独占租赁,仅拥有该形象的使用权,该形象的所有权依旧归腾讯方所有,且腾讯方有权将该形象进行二次租赁。 适合对形象专属要求不高、业务处在初期阶段的客户。
形象定制:通过录制训练或者建模的方式对数智人形象进行定制,适用于对自有形象有要求、对形象需要拥有所有权的客户。
声音复刻:通过对语音数据的采集训练,复刻特定的声音。

 

形象租赁

选择“形象采购”模块,采购类型选择“形象租赁” ,选择需要租赁的形象类型,形象类型之间的差异可参见形象类型说明
挑选对应的形象后,选择租赁的时长即可加入购物车或者直接购买下单。您可租赁基础形象库中的所有形象,形象库详情请参见:2D真人数智人基础形象库3D写实数智人基础形象库
需要注意的是,2D小样本专属口型形象租赁10个形象起售。

 

形象定制

选择“形象采购”模块,采购类型选择“形象定制” ,选择需要定制的形象类型,形象类型之间的差异可参见形象类型说明
2D小样本通用口型、2D小样本专属口型、声音复刻为阶梯定价,购买不同数量所对应的刊例价不同。
不同形象类型定制及效果差异可参见文档 形象对比
购买完成后,您可通过 数智人平台 或者 2D真人小样本形象定制 API 文档-v0.1.0 上传对应的视频/音频进行定制服务。
 
<
产品问答
>
?
2D真人精品和小样本的差别是什么?
在表达环节,2D精品能够支持在文本中指定位置插入特定的动作达到和语义的精准匹配。
?
视频播报场景中,小时包的定义是什么?
小时包时长是指播报数智人服务中,生成视频的时长。
?
腾讯云智能数智人可支持多少语言?
腾讯云智能数智人目前可支持中、英双语的场景应用,如果有更多语言需求,请 联系我们 获得支持。
?
腾讯云智能数智人如何训练新形象?
腾讯云智能数智人主要通过动作捕捉、三维建模、语音合成等技术高度还原真实人类。由人工智能所驱动的数智人,拥有近似真人的形象以及逼真的表情动作,唇形动作能与声音实时同步,且具备表达情感和沟通交流的能力。打造出的高度拟人化虚拟数字形象,能像真人般与人互动沟通,带来全新的感官体验。
?
如何定制和使用腾讯云智能数智人?
按照形象类别可分为2D及3D: 2D分为精品形象和小样本形象,精品形象通过在专业影棚中录制动作素材,经过两周左右的训练可生成应用于播报、交互场景的数字人。精品形象可在文中随机插入指定动作,动作呈现多样性。可支持声音驱动、文本驱动。 小样本形象训练提供3分钟视频,对录制环境无严格要求,即可快速生成和真人一模一样的数字人分身,五官、动作、表情完全模仿真人。可应用与播报场景。您仅需要输入文字或声音,即可快速生成数智人播报视频。 3D数智人生产首先会根据客户的需求设定数智人五官特征、发型、服饰、配饰等完成原画,待客户评审后敲定最终形象后进行模型制作。后经过骨骼绑定、渲染、UE调优等阶段后可输出覆盖交互、播报场景的数智人。可在文中随机插入指定动作,并支持声音驱动、文本驱动。
<
关于我们
>
腾讯云计算(北京)有限责任公司是腾讯云的运营主体,提供包括云服务器、数据库、人工智能、容器服务等在内的300多款云计算产品。公司依托腾讯强大的技术积累,构建了覆盖全球的云计算基础设施,致力于帮助企业实现数字化转型,推动产业升级。腾讯云以安全、稳定、高效的服务,赢得了众多行业客户的信任,成为推动数字经济发展的重要力量。
联系信息
服务时间: 7*24
电话号码: +852 800 906 020(中国香港)
电话号码: +1 844 606 0804(美国)
电话号码: +44 808 196 4551(英国)
邮箱: cloudlegalnotices@tencent.com
网页在线客服: 咨询

为何选择腾讯云

了解各行各业的领先企业为何选择腾讯云来解决最艰巨的挑战。

促进企业数字化转型

• 特色解决方案:为各行业提供全方位的产品及解决方案,企业可根据需要快速搭建系统,调整规模,节约成本,满足个性化需求。
• 多重福利:免费试用多款产品,获专业的技术指导和教程,与国际交流。

丰富行业经验及业务场景

• 行业经验:腾讯云拥有丰富的行业经验,为游戏、金融、教育、电商、传媒、交通物流、制造等多个行业提供一站式解决方案。
• 丰富场景:从基础设施到行业应用领域,提供完善的产品体系,为各种业务场景提供全栈解决方案,助力业务腾飞。

提供以客户为中心的服务

• 灵活计费:后付费直达服务模式,让您先体验多种云产品,以最划算的方式将您的业务上云。
• 客户至上:专业的售后团队为您提供7x24小时的技术服务,助您的企业无忧上云。

赋能企业面向世界• 全球覆盖:已开通全球21个地理区域,运营58个可用区,提供超过3200全球CDN节点,为更多企业提供强有力的技术支持,促进业务快速扩张。
• 安全可靠:7个安全联合实验室团队,超过70项权威认证,腾讯云承诺为您提供安全、可靠、合规的云产品和服务。

利用腾讯 C2B 优势

• C端体验:两大主流社交媒体(微信和QQ)触及超过10亿用户。
• 助力B端:将C端的能力和经验输出到B端,让B端最优响应C端的实际需求,提供个性化的产品和服务。企业可以更好地服务用户,提高供需匹配效率。

 

 

 

 

合作客户

 

 

 

<
最可能同场景使用的其他API
>
API接口列表
<
产品价格
>

<
使用指南
>

形象采购

形象采购是指数智人的形象购买,具体可以分为形象租赁和形象定制两种方式。此外还可以支持对声音的复刻。
形象租赁:通过租赁公共基础形象库内的形象。租赁期间,为无独占租赁,仅拥有该形象的使用权,该形象的所有权依旧归腾讯方所有,且腾讯方有权将该形象进行二次租赁。 适合对形象专属要求不高、业务处在初期阶段的客户。
形象定制:通过录制训练或者建模的方式对数智人形象进行定制,适用于对自有形象有要求、对形象需要拥有所有权的客户。
声音复刻:通过对语音数据的采集训练,复刻特定的声音。

 

形象租赁

选择“形象采购”模块,采购类型选择“形象租赁” ,选择需要租赁的形象类型,形象类型之间的差异可参见形象类型说明
挑选对应的形象后,选择租赁的时长即可加入购物车或者直接购买下单。您可租赁基础形象库中的所有形象,形象库详情请参见:2D真人数智人基础形象库3D写实数智人基础形象库
需要注意的是,2D小样本专属口型形象租赁10个形象起售。

 

形象定制

选择“形象采购”模块,采购类型选择“形象定制” ,选择需要定制的形象类型,形象类型之间的差异可参见形象类型说明
2D小样本通用口型、2D小样本专属口型、声音复刻为阶梯定价,购买不同数量所对应的刊例价不同。
不同形象类型定制及效果差异可参见文档 形象对比
购买完成后,您可通过 数智人平台 或者 2D真人小样本形象定制 API 文档-v0.1.0 上传对应的视频/音频进行定制服务。
 
<
依赖服务
>
<
产品问答
>
?
2D真人精品和小样本的差别是什么?
在表达环节,2D精品能够支持在文本中指定位置插入特定的动作达到和语义的精准匹配。
?
视频播报场景中,小时包的定义是什么?
小时包时长是指播报数智人服务中,生成视频的时长。
?
腾讯云智能数智人可支持多少语言?
腾讯云智能数智人目前可支持中、英双语的场景应用,如果有更多语言需求,请 联系我们 获得支持。
?
腾讯云智能数智人如何训练新形象?
腾讯云智能数智人主要通过动作捕捉、三维建模、语音合成等技术高度还原真实人类。由人工智能所驱动的数智人,拥有近似真人的形象以及逼真的表情动作,唇形动作能与声音实时同步,且具备表达情感和沟通交流的能力。打造出的高度拟人化虚拟数字形象,能像真人般与人互动沟通,带来全新的感官体验。
?
如何定制和使用腾讯云智能数智人?
按照形象类别可分为2D及3D: 2D分为精品形象和小样本形象,精品形象通过在专业影棚中录制动作素材,经过两周左右的训练可生成应用于播报、交互场景的数字人。精品形象可在文中随机插入指定动作,动作呈现多样性。可支持声音驱动、文本驱动。 小样本形象训练提供3分钟视频,对录制环境无严格要求,即可快速生成和真人一模一样的数字人分身,五官、动作、表情完全模仿真人。可应用与播报场景。您仅需要输入文字或声音,即可快速生成数智人播报视频。 3D数智人生产首先会根据客户的需求设定数智人五官特征、发型、服饰、配饰等完成原画,待客户评审后敲定最终形象后进行模型制作。后经过骨骼绑定、渲染、UE调优等阶段后可输出覆盖交互、播报场景的数智人。可在文中随机插入指定动作,并支持声音驱动、文本驱动。
<
关于我们
>
腾讯云计算(北京)有限责任公司是腾讯云的运营主体,提供包括云服务器、数据库、人工智能、容器服务等在内的300多款云计算产品。公司依托腾讯强大的技术积累,构建了覆盖全球的云计算基础设施,致力于帮助企业实现数字化转型,推动产业升级。腾讯云以安全、稳定、高效的服务,赢得了众多行业客户的信任,成为推动数字经济发展的重要力量。
联系信息
服务时间: 7*24
电话号码: +852 800 906 020(中国香港)
电话号码: +1 844 606 0804(美国)
电话号码: +44 808 196 4551(英国)
邮箱: cloudlegalnotices@tencent.com
网页在线客服: 咨询

为何选择腾讯云

了解各行各业的领先企业为何选择腾讯云来解决最艰巨的挑战。

促进企业数字化转型

• 特色解决方案:为各行业提供全方位的产品及解决方案,企业可根据需要快速搭建系统,调整规模,节约成本,满足个性化需求。
• 多重福利:免费试用多款产品,获专业的技术指导和教程,与国际交流。

丰富行业经验及业务场景

• 行业经验:腾讯云拥有丰富的行业经验,为游戏、金融、教育、电商、传媒、交通物流、制造等多个行业提供一站式解决方案。
• 丰富场景:从基础设施到行业应用领域,提供完善的产品体系,为各种业务场景提供全栈解决方案,助力业务腾飞。

提供以客户为中心的服务

• 灵活计费:后付费直达服务模式,让您先体验多种云产品,以最划算的方式将您的业务上云。
• 客户至上:专业的售后团队为您提供7x24小时的技术服务,助您的企业无忧上云。

赋能企业面向世界• 全球覆盖:已开通全球21个地理区域,运营58个可用区,提供超过3200全球CDN节点,为更多企业提供强有力的技术支持,促进业务快速扩张。
• 安全可靠:7个安全联合实验室团队,超过70项权威认证,腾讯云承诺为您提供安全、可靠、合规的云产品和服务。

利用腾讯 C2B 优势

• C端体验:两大主流社交媒体(微信和QQ)触及超过10亿用户。
• 助力B端:将C端的能力和经验输出到B端,让B端最优响应C端的实际需求,提供个性化的产品和服务。企业可以更好地服务用户,提高供需匹配效率。

 

 

 

 

合作客户

 

 

 

<
合作案例
>
<
最可能同场景使用的其他API
>