AI数字人视频生成服务-D human

AI数字人视频生成服务-D human

专用API
【更新时间: 2024.07.17】 D-Human是广州深声科技(Deepsound)推出的先进数字人技术,由小米科技投资,中科院博士团队研发。提供1:1真人还原效果,支持SaaS、API和OEM等多种合作模式,确保5天内快速交付。
服务星级:2星
⭐ ⭐ 🌟 🌟 🌟 🌟 🌟
调用次数
0
集成人数
0
商用人数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是AI数字人视频生成服务-D human?

“AI数字人视频生成服务” 是利用人工智能技术生成虚拟数字人的视频服务。这种技术结合了图像处理、语音合成和自然语言处理等多项技术,能够快速生成高质量的数字人视频,广泛应用于虚拟主持人、虚拟客服、在线教育等领域。

什么是AI数字人视频生成服务-D human接口?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用AI数字人视频生成服务-D human,从而实现程序的自动化交互,提高服务效率。

AI数字人视频生成服务-D human有哪些核心功能?

数字人1:1真人还原,效果业界领先
 
中科院博士带队攻关,掌握数字人全栈技术
  • 门槛低:8分钟视频即可克隆自己/他人
  • 效果好:形象逼真,动作自然,还原度评分95+。
  • 成本低:千元级数字人定制,绝对的价格优势。
  • 交付快:支持SaaS使用、API接入、OEM定制,5天内交付。
克隆目标人声音,让数字人效果无限接近真人
 
多次斩获国内外大奖,累计用户20,000,000+
覆盖全行业的原创视频模板,助你三步出片
 
选模板 > 改文案 > 点“生成”,爆款信手拈来
  • 画面:无需调整布局,资深设计师为你操刀解决。
  • 文案:无需苦思文案台词,资深营销师替你精雕细琢。
  • 商用:全平台正版素材,商用无忧。

AI数字人视频生成服务-D human的核心优势是什么?

  1. 95+:数字人还原度评分95+,业界领先
  2. 20,000,000+:形象克隆+声音克隆累计用户超过两千万
  3. SaaS/API/OEM:为科技企业、MCN、自媒体提供多种合作方式
  4. 丰富的合作方式:数字人平台D-Human、数字人平台OEM定制、API接入、渠道入驻

在哪些场景会用到AI数字人视频生成服务-D human接口?

知识口播

知识口播是一种通过口头传播知识的方式,通常涉及教育、科普等领域。它可以通过电台、播客、视频平台等渠道进行传播,内容涵盖历史、科学、文化等多个方面。

金融保险

金融保险是指通过保险合同,将个人或企业面临的风险转移给保险公司的一种金融活动。它包括人寿保险、财产保险、健康保险等多种类型,旨在为投保人提供经济保障和风险管理。

企业宣传

企业宣传是指企业通过各种媒介和活动,向公众传递其品牌、产品、服务等信息的过程。这包括广告、公关活动、社交媒体营销等,目的是提升企业形象和知名度,吸引潜在客户。

直播带货

直播带货是一种新兴的电商模式,通过直播平台展示商品并实时互动,促进商品销售。主播通过展示商品、试用体验、解答问题等方式,吸引观众购买,增加销售额。

新闻播报

新闻播报是媒体通过电视、广播、网络等渠道,向公众传递新闻信息的一种方式。它包括新闻事件的报道、评论、分析等,旨在提供及时、准确的新闻资讯,满足公众的知情权。

 

<
产品价格
>

<
使用指南
>

声科技数字人接口文档

I. 接口调用基础

  1. 接口使用HTTP 1.1 协议,遵循RESTful规范;
  2. 接口调用的基础地址:https://api.deepsound.cn/
  3. 鉴权流程, 请参考深声官网签名方式: 签名方式

 

II. 数字人管理接口

数字人管理接口交互流程如下:
图片

2.1 数字人生成

请求路径

接口标识 请求路径 请求方式 说明
avatar.v1.2D.createModel /avatar/v1/2d/model/create POST 用于创建数字人。需要提前将视频素材转换为互联网可访问的URL。

 

请求体

字段名 类型 是否必选 说明
video_url URL 数字人视频链接,不超过256字符。视频需要符合视频录制标准
callback_url URL 数字人构建结果回调URL;回调调用规格请参考avatar.v1.2D.callback.createModel
name String 数字人名称,不超过64字符。
client_info String 用户自定义的文本信息,用于标识、备注等用途;不超过256字符。

 

返回值

字段名 类型 是否返回 说明
code Integer 响应成功时取值为整数0, 其它取值详见状态码说明。
message String 关于响应结果的说明。
data Object 后续表格中,"data.x"表示data对象的属性x。如果code不为0,data字段为空,data中的其他数据将无法获取。
data.model_id String 数字人创建之后的唯一id,用于后续的生成进度查询、视频生成。

 

错误码

错误码 错误码说明
2005 不支持的视频类型
2006 视频大小不符合要求

 

调用示例

curl 命令行

curl -X POST -H 'Accept: */*' -H 'Accept-Encoding: gzip, deflate, br' -H 'Connection: keep-alive' -H 'Content-Length: 177' -H 'Content-Type: application/json' -H 'X-Deepsound-Appid: testAppId' -H 'X-Deepsound-Sign: MD5 1218F24F52A36307C989C92F987056C5' -H 'X-Deepsound-Timestamp: 1664348729' -d '{"video_url": "https://tideo.oss-cn-shanghai.aliyuncs.com/upload/video/xxxx.mp4", "client_info": "{\"client_id\": 123456}", "callback_url": null, "name": "MyAvatar1"}' https://api.deepsound.cn/avatar/v1/2d/model/create

返回值

{
   "code": 0,
   "data": {
	  "model_id": "43667"
   },
   "message": "操作成功"
}

 

详情参考:https://www.d-human.cn/dev#dhuman

 

<
关于我们
>
公司实力:广州深声科技有限公司是一家专注于智能语音及数字人技术研发的国家高新技术企业,荣获小米科技千万融资及诸多国际大奖。 标杆客户:曾先后为小米、OPPO、中国科学院、网易云音乐、烽火科技、深圳大学、深圳职业技术学院、国泰安等企事业机构提供智能语音及数字人专业服务。 应用领域:覆盖政府机构、科技技术、智能终端、教育、新零售等诸多领域。
联系信息
服务时间: 00:00:00至24:00:00
电话号码: 19076003628
邮箱: support@deepsound.cn
邮箱: mandy@deepsound.cn

广州深声科技有限公司(Deepsound)是一家专注于数字人与智能语音的技术研发和应用服务商,2018年获得小米数千万战略投资。深声核心团队来自中科院、腾讯、YY,拥有数字人互动内容服务全栈核心技术,获得各个行业客户及社会的认可,先后获颁:

 

国家高新技术企业

 

北京信息产业协会元宇宙专委会发起单位

 

广州市人工智能产业促进会常务理事单位

 

国际语音合成大赛BlizzardChallenge 2019第二名

 

2023年度广州市重点研发计划人工智能重大科技专项第一名

 

第十一届中国创新创业大赛(广州赛区)第四名

 

深声科技致力于将数字人技术带入人们生活的方方面面,赋予企业和用户创新与科技力量,共同创造更美好的世界。

<
最可能同场景使用的其他API
>
API接口列表
<
产品价格
>

<
使用指南
>

声科技数字人接口文档

I. 接口调用基础

  1. 接口使用HTTP 1.1 协议,遵循RESTful规范;
  2. 接口调用的基础地址:https://api.deepsound.cn/
  3. 鉴权流程, 请参考深声官网签名方式: 签名方式

 

II. 数字人管理接口

数字人管理接口交互流程如下:
图片

2.1 数字人生成

请求路径

接口标识 请求路径 请求方式 说明
avatar.v1.2D.createModel /avatar/v1/2d/model/create POST 用于创建数字人。需要提前将视频素材转换为互联网可访问的URL。

 

请求体

字段名 类型 是否必选 说明
video_url URL 数字人视频链接,不超过256字符。视频需要符合视频录制标准
callback_url URL 数字人构建结果回调URL;回调调用规格请参考avatar.v1.2D.callback.createModel
name String 数字人名称,不超过64字符。
client_info String 用户自定义的文本信息,用于标识、备注等用途;不超过256字符。

 

返回值

字段名 类型 是否返回 说明
code Integer 响应成功时取值为整数0, 其它取值详见状态码说明。
message String 关于响应结果的说明。
data Object 后续表格中,"data.x"表示data对象的属性x。如果code不为0,data字段为空,data中的其他数据将无法获取。
data.model_id String 数字人创建之后的唯一id,用于后续的生成进度查询、视频生成。

 

错误码

错误码 错误码说明
2005 不支持的视频类型
2006 视频大小不符合要求

 

调用示例

curl 命令行

curl -X POST -H 'Accept: */*' -H 'Accept-Encoding: gzip, deflate, br' -H 'Connection: keep-alive' -H 'Content-Length: 177' -H 'Content-Type: application/json' -H 'X-Deepsound-Appid: testAppId' -H 'X-Deepsound-Sign: MD5 1218F24F52A36307C989C92F987056C5' -H 'X-Deepsound-Timestamp: 1664348729' -d '{"video_url": "https://tideo.oss-cn-shanghai.aliyuncs.com/upload/video/xxxx.mp4", "client_info": "{\"client_id\": 123456}", "callback_url": null, "name": "MyAvatar1"}' https://api.deepsound.cn/avatar/v1/2d/model/create

返回值

{
   "code": 0,
   "data": {
	  "model_id": "43667"
   },
   "message": "操作成功"
}

 

详情参考:https://www.d-human.cn/dev#dhuman

 

<
依赖服务
>
<
关于我们
>
公司实力:广州深声科技有限公司是一家专注于智能语音及数字人技术研发的国家高新技术企业,荣获小米科技千万融资及诸多国际大奖。 标杆客户:曾先后为小米、OPPO、中国科学院、网易云音乐、烽火科技、深圳大学、深圳职业技术学院、国泰安等企事业机构提供智能语音及数字人专业服务。 应用领域:覆盖政府机构、科技技术、智能终端、教育、新零售等诸多领域。
联系信息
服务时间: 00:00:00至24:00:00
电话号码: 19076003628
邮箱: support@deepsound.cn
邮箱: mandy@deepsound.cn

广州深声科技有限公司(Deepsound)是一家专注于数字人与智能语音的技术研发和应用服务商,2018年获得小米数千万战略投资。深声核心团队来自中科院、腾讯、YY,拥有数字人互动内容服务全栈核心技术,获得各个行业客户及社会的认可,先后获颁:

 

国家高新技术企业

 

北京信息产业协会元宇宙专委会发起单位

 

广州市人工智能产业促进会常务理事单位

 

国际语音合成大赛BlizzardChallenge 2019第二名

 

2023年度广州市重点研发计划人工智能重大科技专项第一名

 

第十一届中国创新创业大赛(广州赛区)第四名

 

深声科技致力于将数字人技术带入人们生活的方方面面,赋予企业和用户创新与科技力量,共同创造更美好的世界。

<
最可能同场景使用的其他API
>