AI离线数字人生成服务-AIGC
专用API
服务商:
新华智云科技有限公司
【更新时间: 2024.07.15】
AI离线数字人是指存在于非物理世界中,基于计算机图形学、图形渲染、动作捕捉、深度学习、语音合成、人像建模等人工智能技术,创造出来的一个可供真人或计算机驱动的形象实体,具有对物理世界的感知、认知与表达能力。
咨询
去服务商官网采购>
|
服务星级:6星
浏览次数
32
采购人数
0
试用次数
0
SLA: N/A
响应: N/A
适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
|
- API详情
- 使用指南
- 常见 FAQ
- 关于我们
- 相关推荐
什么是AIGC的AI离线数字人生成服务?
AI离线数字人是指存在于非物理世界中,基于计算机图形学、图形渲染、动作捕捉、深度学习、语音合成、人像建模等人工智能技术,创造出来的一个可供真人或计算机驱动的形象实体,具有对物理世界的感知、认知与表达能力,以电子屏、VR、AR等设备为载体,实现人机交互;通过其面向媒体、金融、会议、文旅、娱乐、教育、医疗等行业,提供全新智能型服务,降低人力成本,提升服务质量和效率。在技术层面,虚拟数字人可被分为真人灵活驱动型和基于深度学习算法,智能驱动型两类。 新华智云自主研发了真人驱动和智能驱动数字人技术,结合深度学习神经网络和计算机图形学,深度钻研声音或视觉信息到面部及身体动作的建模和渲染,让计算机能够理解语音和图像的内容并以此精细驱动数字人形象的口唇、面部表情、头部乃至全身的动作,生成极具逼真感的数字人视频,进而实现AI驱动数字人的内容生产链路。同时,新华智云数字人技术全方位覆盖了包含2D仿真人数字人、2D卡通数字人、3D卡通数字人、3D写实数字人等各个类型的数字人创造链路。 作为“懂内容的技术公司”,新华智云将数字人技术与专业视频编辑系统相结合,推出数字人大厅这款虚拟数字人的视频编辑与生产平台,为内容生产者提供涉及数字人相关的内容采集、编辑、存储、分发等全生产链的专有技术。在国内乃至全球的数字人技术领域新华智云数字人技术都处于领先地位。
什么是AIGC的AI离线数字人生成服务?
AIGC的AI离线数字人生成服务有哪些核心功能?
- 照片快速生成3D数字人:通过用户提供的照片,自动进行人脸骨骼点预测,并自动化捏制3D人脸模型,生成高度逼真的数字分身。
- 视频采集生成2D数字人:支持用户上传2-5分钟的视频,从中提取关键帧,快速生成高定2D真人数字人,同时支持定制形象、声音和动作。
- 实时渲染与智能交互:提供实时渲染技术,支持数字人在多种场景下的智能交互,包括问答、表情变化、动作执行等。
- 定制化服务:提供丰富的数字人形象库,并支持用户根据需求进行定制化服务,包括形象设计、声音合成、动作捕捉等。
- API接口接入:提供API接口,方便用户将生成的数字人集成到自己的应用或系统中,实现无缝对接。
AIGC的AI离线数字人生成服务的核心优势是什么?
- 高效快速:通过自动化流程,大大缩短了数字人生成的时间,提高了效率。
- 高度逼真:利用先进的计算机图形学和深度学习技术,生成的数字人形象高度逼真,接近真人效果。
- 定制化强:提供丰富的定制化选项,满足不同用户的个性化需求。
- 易于集成:提供便捷的API接口,方便用户将数字人集成到自己的业务系统中。
- 应用场景广泛:适用于媒体、金融、会议、文旅、娱乐、教育、医疗等多个领域,为用户提供全新的智能型服务体验。
在哪些场景会用到AIGC的AI离线数字人生成服务?
1. 媒体行业:虚拟主播制作
在媒体行业中,AIGC技术被广泛应用于新闻播报、天气预报、综艺节目等节目的虚拟主播制作。虚拟数字主持人不仅承担了日常新闻播报,还可进行多语种翻译,在重要活动中进行了展示。河北广电AIGC联合实验室打造的AI主持人融合了深度学习模式和高精度渲染技术,实现了语音与表情的高度拟真效果。这些虚拟主播不仅提高了节目的制作效率,还为观众带来了新颖的观看体验。
2. 金融行业:虚拟客服与顾问
在金融行业,AIGC技术的应用体现在虚拟客服或虚拟顾问的角色上,它们能够提供全天候的客户服务或产品介绍。这些虚拟数字人通过自然语言处理等技术,可以准确理解用户需求,并给出满意的答复。通过AIGC实现金融资讯、产品介绍视频内容的自动化生产,以及塑造虚拟数字人客服,这不仅提升了服务效率,还增强了用户的互动体验。
3. 教育行业:虚拟教师与助教
在教育行业,AIGC技术被用作虚拟教师或助教,辅助教学活动或提供学习资源。AIGC技术通过分析用户数据,为传媒艺术领域提供了个性化内容生成的可能,这在推荐系统和定制化服务中尤为重要。同时,AIGC技术也在教育和培训领域展现出巨大潜力,通过虚拟教师和模拟训练环境,为学生提供了更加互动和沉浸式的学习体验,从而变革了传统的教育模式。
2. 娱乐行业:虚拟偶像与角色
在娱乐行业,AIGC技术作为虚拟偶像或角色,参与游戏、动画、电影等娱乐内容的制作。AIGC技术使得虚拟偶像的创作变得更加简单。虚拟数字人可以通过学习大量数据来模拟偶像的言行举止,甚至可以根据用户需求进行个性化表演,为用户带来全新的视听体验。一些AIGC项目开始运用在虚拟偶像二创领域,粉丝用AI作画工具为心爱的虚拟偶像创作插画甚至是cosplay,丰富衍生的图片内容。这些技术的进步让虚拟偶像的二创跨出了一大步,不再局限于视觉,为娱乐产业带来了新的可能性。
1. 概述
离线数字人API支持2D仿真和3D写实数字人合成服务。本文档将指导开发者如何使用该API,包括接口调用、参数说明和常见错误处理。
2. 域名及请求加签
-
请求地址:
https://api.shuwen.com
-
请求方式: GET/POST
-
接口路径示例:
/open/digitalMan/pageQuery?pageNo=1&pageSize=10
3. 数字人列表查询接口
3.1 接口调用
-
请求方式: GET
-
请求路径:
/open/digitalMan/pageQuery
-
请求参数:
-
pageNo
(必填): Integer, 分页页码 -
pageSize
(必填): Integer, 分页大小
-
3.2 接口结果
-
返回数据结构:
-
total
: 数据总量 -
data
: 数字人信息数组-
id
: 数字人ID -
name
: 名称 -
description
: 描述 -
preImg
: 预览图
-
-
4. 数字人详情查询接口
4.1 接口调用
-
请求方式: GET
-
请求路径:
/open/digitalMan/detaiQuery/
-
请求参数: 数字人ID(必填)
4.2 接口结果
-
返回数据结构包括:
-
voices
: 数字人声音信息 -
clothes
: 数字人服饰信息
-
5. 数字人合成相关接口
5.1 合成接口调用
-
请求方式: POST
-
请求路径:
/open/digitalMan/batch/generate
-
请求参数:
{
"generateParam": [
{
"algoParam": {
"video": {},
"background": "背景图URL",
"tts": {
"text": "合成文本",
"per": "声音ID"
},
"position": [0, 0, 1080, 1801],
"code": "数字人编码",
"is_green": true,
"subtitle": true
}
}
],
"callBackUrl": "回调地址"
}
5.2 合成接口结果
-
返回任务的
groupId
5.3 合成任务查询接口
-
请求方式: GET
-
请求路径:
/open/digitalMan/batch/query/
-
请求参数:
groupId
5.4 合成任务结果返回
-
返回数据包括:
-
status
: 当前子任务合成状态 -
composeUrl
: 合成视频的URL -
textSegs
: 播报内容的相关信息
-
5.5 异步回调方式
-
客户端需根据签名验证回调请求的合法性。
6. 字幕文件生成
6.1 接口调用
-
请求方式: POST
-
请求路径:
/open/digitalMan/subtitle/generate
-
请求参数:
-
taskId
: 任务ID -
type
: 字幕类型(可选,默认srt
)
-
6.2 合成结果
-
返回字幕文件的URL
7. 常见错误码
-
SW-DM-1000
: 合成任务创建失败 -
SW-DM-1001
: 租户ID缺失 -
SW-DM-1002
: 主参数缺失 -
SW-DM-1003
:generateParam
参数缺失 -
SW-DM-1004
:algoParam
参数缺失 -
SW-DM-1005
: 数字人形象code参数缺失 -
SW-DM-1006
:tts
参数缺失
8. 结语
指南详情链接:https://aigc.shuwen.com/docs/zh-cn/human/real.html
虚拟数字人是指存在于非物理世界中,基于计算机图形学、图形渲染、动作捕捉、深度学习、语音合成、人像建模等人工智能技术,创造出来的一个可供真人或计算机驱动的形象实体,具有对物理世界的感知、认知与表达能力,以电子屏、VR、AR等设备为载体,实现人机交互;通过其面向媒体、金融、会议、文旅、娱乐、教育、医疗等行业,提供全新智能型服务,降低人力成本,提升服务质量和效率。在技术层面,虚拟数字人可被分为真人灵活驱动型和基于深度学习算法,智能驱动型两类。 新华智云自主研发了真人驱动和智能驱动数字人技术,结合深度学习神经网络和计算机图形学,深度钻研声音或视觉信息到面部及身体动作的建模和渲染,让计算机能够理解语音和图像的内容并以此精细驱动数字人形象的口唇、面部表情、头部乃至全身的动作,生成极具逼真感的数字人视频,进而实现AI驱动数字人的内容生产链路。同时,新华智云数字人技术全方位覆盖了包含2D仿真人数字人、2D卡通数字人、3D卡通数字人、3D写实数字人等各个类型的数字人创造链路。 作为“懂内容的技术公司”,新华智云将数字人技术与专业视频编辑系统相结合,推出数字人大厅这款虚拟数字人的视频编辑与生产平台,为内容生产者提供涉及数字人相关的内容采集、编辑、存储、分发等全生产链的专有技术。在国内乃至全球的数字人技术领域新华智云数字人技术都处于领先地位。早在2019年6月我方产品已经投入市场使用。目前已经有超过280家国内机构、覆盖了22个省、使用我方数字人产品,市场成熟度高、并已应用在媒体、文旅、会展、金融等领域。
1. 概述
离线数字人API支持2D仿真和3D写实数字人合成服务。本文档将指导开发者如何使用该API,包括接口调用、参数说明和常见错误处理。
2. 域名及请求加签
-
请求地址:
https://api.shuwen.com
-
请求方式: GET/POST
-
接口路径示例:
/open/digitalMan/pageQuery?pageNo=1&pageSize=10
3. 数字人列表查询接口
3.1 接口调用
-
请求方式: GET
-
请求路径:
/open/digitalMan/pageQuery
-
请求参数:
-
pageNo
(必填): Integer, 分页页码 -
pageSize
(必填): Integer, 分页大小
-
3.2 接口结果
-
返回数据结构:
-
total
: 数据总量 -
data
: 数字人信息数组-
id
: 数字人ID -
name
: 名称 -
description
: 描述 -
preImg
: 预览图
-
-
4. 数字人详情查询接口
4.1 接口调用
-
请求方式: GET
-
请求路径:
/open/digitalMan/detaiQuery/
-
请求参数: 数字人ID(必填)
4.2 接口结果
-
返回数据结构包括:
-
voices
: 数字人声音信息 -
clothes
: 数字人服饰信息
-
5. 数字人合成相关接口
5.1 合成接口调用
-
请求方式: POST
-
请求路径:
/open/digitalMan/batch/generate
-
请求参数:
{
"generateParam": [
{
"algoParam": {
"video": {},
"background": "背景图URL",
"tts": {
"text": "合成文本",
"per": "声音ID"
},
"position": [0, 0, 1080, 1801],
"code": "数字人编码",
"is_green": true,
"subtitle": true
}
}
],
"callBackUrl": "回调地址"
}
5.2 合成接口结果
-
返回任务的
groupId
5.3 合成任务查询接口
-
请求方式: GET
-
请求路径:
/open/digitalMan/batch/query/
-
请求参数:
groupId
5.4 合成任务结果返回
-
返回数据包括:
-
status
: 当前子任务合成状态 -
composeUrl
: 合成视频的URL -
textSegs
: 播报内容的相关信息
-
5.5 异步回调方式
-
客户端需根据签名验证回调请求的合法性。
6. 字幕文件生成
6.1 接口调用
-
请求方式: POST
-
请求路径:
/open/digitalMan/subtitle/generate
-
请求参数:
-
taskId
: 任务ID -
type
: 字幕类型(可选,默认srt
)
-
6.2 合成结果
-
返回字幕文件的URL
7. 常见错误码
-
SW-DM-1000
: 合成任务创建失败 -
SW-DM-1001
: 租户ID缺失 -
SW-DM-1002
: 主参数缺失 -
SW-DM-1003
:generateParam
参数缺失 -
SW-DM-1004
:algoParam
参数缺失 -
SW-DM-1005
: 数字人形象code参数缺失 -
SW-DM-1006
:tts
参数缺失
8. 结语
指南详情链接:https://aigc.shuwen.com/docs/zh-cn/human/real.html
虚拟数字人是指存在于非物理世界中,基于计算机图形学、图形渲染、动作捕捉、深度学习、语音合成、人像建模等人工智能技术,创造出来的一个可供真人或计算机驱动的形象实体,具有对物理世界的感知、认知与表达能力,以电子屏、VR、AR等设备为载体,实现人机交互;通过其面向媒体、金融、会议、文旅、娱乐、教育、医疗等行业,提供全新智能型服务,降低人力成本,提升服务质量和效率。在技术层面,虚拟数字人可被分为真人灵活驱动型和基于深度学习算法,智能驱动型两类。 新华智云自主研发了真人驱动和智能驱动数字人技术,结合深度学习神经网络和计算机图形学,深度钻研声音或视觉信息到面部及身体动作的建模和渲染,让计算机能够理解语音和图像的内容并以此精细驱动数字人形象的口唇、面部表情、头部乃至全身的动作,生成极具逼真感的数字人视频,进而实现AI驱动数字人的内容生产链路。同时,新华智云数字人技术全方位覆盖了包含2D仿真人数字人、2D卡通数字人、3D卡通数字人、3D写实数字人等各个类型的数字人创造链路。 作为“懂内容的技术公司”,新华智云将数字人技术与专业视频编辑系统相结合,推出数字人大厅这款虚拟数字人的视频编辑与生产平台,为内容生产者提供涉及数字人相关的内容采集、编辑、存储、分发等全生产链的专有技术。在国内乃至全球的数字人技术领域新华智云数字人技术都处于领先地位。早在2019年6月我方产品已经投入市场使用。目前已经有超过280家国内机构、覆盖了22个省、使用我方数字人产品,市场成熟度高、并已应用在媒体、文旅、会展、金融等领域。