AI离线数字人生成服务-AIGC

专用API

【更新时间: 2024.07.15】 AI离线数字人是指存在于非物理世界中，基于计算机图形学、图形渲染、动作捕捉、深度学习、语音合成、人像建模等人工智能技术，创造出来的一个可供真人或计算机驱动的形象实体，具有对物理世界的感知、认知与表达能力。

咨询去服务商官网采购>

浏览次数

161

采购人数

试用次数

SLA: N/A

响应: N/A

适用于个人&企业

书签名称

确定

相似API

火山引擎音色转换

309

音色转换方案是指通过输入任意用户语音，输出指定音色的声音，实现语音趣味变声，丰富语音交互体验；可应用于音视频创作、虚拟形象、电商直播、游戏、汽车等场景。

火山引擎人像畸变矫正

人像畸变矫正基于深度学习算法，智能修复因镜头畸变对人像产生的拉伸和变形。适用场景有智能图像优化，如图库、社交、PUGC内容平台的图像质量优化场景，高效解决人像畸变的问题。

AI虚拟人交互平台-科大讯飞

164

API详情
使用指南
常见 FAQ
关于我们
相关推荐

产品介绍

什么是AIGC的AI离线数字人生成服务?

AI离线数字人是指存在于非物理世界中，基于计算机图形学、图形渲染、动作捕捉、深度学习、语音合成、人像建模等人工智能技术，创造出来的一个可供真人或计算机驱动的形象实体，具有对物理世界的感知、认知与表达能力，以电子屏、VR、AR等设备为载体，实现人机交互；通过其面向媒体、金融、会议、文旅、娱乐、教育、医疗等行业，提供全新智能型服务，降低人力成本，提升服务质量和效率。在技术层面，虚拟数字人可被分为真人灵活驱动型和基于深度学习算法，智能驱动型两类。新华智云自主研发了真人驱动和智能驱动数字人技术，结合深度学习神经网络和计算机图形学，深度钻研声音或视觉信息到面部及身体动作的建模和渲染，让计算机能够理解语音和图像的内容并以此精细驱动数字人形象的口唇、面部表情、头部乃至全身的动作，生成极具逼真感的数字人视频，进而实现AI驱动数字人的内容生产链路。同时，新华智云数字人技术全方位覆盖了包含2D仿真人数字人、2D卡通数字人、3D卡通数字人、3D写实数字人等各个类型的数字人创造链路。作为“懂内容的技术公司”，新华智云将数字人技术与专业视频编辑系统相结合，推出数字人大厅这款虚拟数字人的视频编辑与生产平台，为内容生产者提供涉及数字人相关的内容采集、编辑、存储、分发等全生产链的专有技术。在国内乃至全球的数字人技术领域新华智云数字人技术都处于领先地位。

AIGC的AI离线数字人生成服务有哪些核心功能？

照片快速生成3D数字人：通过用户提供的照片，自动进行人脸骨骼点预测，并自动化捏制3D人脸模型，生成高度逼真的数字分身。
视频采集生成2D数字人：支持用户上传2-5分钟的视频，从中提取关键帧，快速生成高定2D真人数字人，同时支持定制形象、声音和动作。
实时渲染与智能交互：提供实时渲染技术，支持数字人在多种场景下的智能交互，包括问答、表情变化、动作执行等。
定制化服务：提供丰富的数字人形象库，并支持用户根据需求进行定制化服务，包括形象设计、声音合成、动作捕捉等。
API接口接入：提供API接口，方便用户将生成的数字人集成到自己的应用或系统中，实现无缝对接。

AIGC的AI离线数字人生成服务的核心优势是什么？

高效快速：通过自动化流程，大大缩短了数字人生成的时间，提高了效率。
高度逼真：利用先进的计算机图形学和深度学习技术，生成的数字人形象高度逼真，接近真人效果。
定制化强：提供丰富的定制化选项，满足不同用户的个性化需求。
易于集成：提供便捷的API接口，方便用户将数字人集成到自己的业务系统中。
应用场景广泛：适用于媒体、金融、会议、文旅、娱乐、教育、医疗等多个领域，为用户提供全新的智能型服务体验。

在哪些场景会用到AIGC的AI离线数字人生成服务？

1. 媒体行业：虚拟主播制作

在媒体行业中，AIGC技术被广泛应用于新闻播报、天气预报、综艺节目等节目的虚拟主播制作。虚拟数字主持人不仅承担了日常新闻播报，还可进行多语种翻译，在重要活动中进行了展示。河北广电AIGC联合实验室打造的AI主持人融合了深度学习模式和高精度渲染技术，实现了语音与表情的高度拟真效果。这些虚拟主播不仅提高了节目的制作效率，还为观众带来了新颖的观看体验。

2. 金融行业：虚拟客服与顾问

在金融行业，AIGC技术的应用体现在虚拟客服或虚拟顾问的角色上，它们能够提供全天候的客户服务或产品介绍。这些虚拟数字人通过自然语言处理等技术，可以准确理解用户需求，并给出满意的答复。通过AIGC实现金融资讯、产品介绍视频内容的自动化生产，以及塑造虚拟数字人客服，这不仅提升了服务效率，还增强了用户的互动体验。

3. 教育行业：虚拟教师与助教

在教育行业，AIGC技术被用作虚拟教师或助教，辅助教学活动或提供学习资源。AIGC技术通过分析用户数据，为传媒艺术领域提供了个性化内容生成的可能，这在推荐系统和定制化服务中尤为重要。同时，AIGC技术也在教育和培训领域展现出巨大潜力，通过虚拟教师和模拟训练环境，为学生提供了更加互动和沉浸式的学习体验，从而变革了传统的教育模式。

2. 娱乐行业：虚拟偶像与角色

在娱乐行业，AIGC技术作为虚拟偶像或角色，参与游戏、动画、电影等娱乐内容的制作。AIGC技术使得虚拟偶像的创作变得更加简单。虚拟数字人可以通过学习大量数据来模拟偶像的言行举止，甚至可以根据用户需求进行个性化表演，为用户带来全新的视听体验。一些AIGC项目开始运用在虚拟偶像二创领域，粉丝用AI作画工具为心爱的虚拟偶像创作插画甚至是cosplay，丰富衍生的图片内容。这些技术的进步让虚拟偶像的二创跨出了一大步，不再局限于视觉，为娱乐产业带来了新的可能性。

使用指南

开发者入门指南：离线数字人API

1. 概述

离线数字人API支持2D仿真和3D写实数字人合成服务。本文档将指导开发者如何使用该API，包括接口调用、参数说明和常见错误处理。

2. 域名及请求加签

请求地址: https://api.shuwen.com
请求方式: GET/POST
接口路径示例: /open/digitalMan/pageQuery?pageNo=1&pageSize=10

3. 数字人列表查询接口

3.1 接口调用

请求方式: GET
请求路径: /open/digitalMan/pageQuery
请求参数:
- pageNo (必填): Integer, 分页页码
- pageSize (必填): Integer, 分页大小

3.2 接口结果

返回数据结构:
- total: 数据总量
- data: 数字人信息数组
  - id: 数字人ID
  - name: 名称
  - description: 描述
  - preImg: 预览图

4. 数字人详情查询接口

4.1 接口调用

请求方式: GET
请求路径: /open/digitalMan/detaiQuery/
请求参数: 数字人ID（必填）

4.2 接口结果

返回数据结构包括:
- voices: 数字人声音信息
- clothes: 数字人服饰信息

5. 数字人合成相关接口

5.1 合成接口调用

请求方式: POST
请求路径: /open/digitalMan/batch/generate

请求参数:

{
  "generateParam": [
    {
      "algoParam": {
        "video": {},
        "background": "背景图URL",
        "tts": {
          "text": "合成文本",
          "per": "声音ID"
        },
        "position": [0, 0, 1080, 1801],
        "code": "数字人编码",
        "is_green": true,
        "subtitle": true
      }
    }
  ],
  "callBackUrl": "回调地址"
}

5.2 合成接口结果

返回任务的 groupId

5.3 合成任务查询接口

请求方式: GET
请求路径: /open/digitalMan/batch/query/
请求参数: groupId

5.4 合成任务结果返回

返回数据包括:
- status: 当前子任务合成状态
- composeUrl: 合成视频的URL
- textSegs: 播报内容的相关信息

5.5 异步回调方式

客户端需根据签名验证回调请求的合法性。

6. 字幕文件生成

6.1 接口调用

请求方式: POST
请求路径: /open/digitalMan/subtitle/generate
请求参数:
- taskId: 任务ID
- type: 字幕类型（可选，默认srt）

6.2 合成结果

返回字幕文件的URL

7. 常见错误码

SW-DM-1000: 合成任务创建失败
SW-DM-1001: 租户ID缺失
SW-DM-1002: 主参数缺失
SW-DM-1003: generateParam参数缺失
SW-DM-1004: algoParam参数缺失
SW-DM-1005: 数字人形象code参数缺失
SW-DM-1006: tts参数缺失

8. 结语

通过以上步骤，开发者可以快速上手新华智云离线数字人API，进行数字人的查询和合成。请根据实际需求调整参数和请求方式，确保接口调用的成功。

指南详情链接：https://aigc.shuwen.com/docs/zh-cn/human/real.html

产品问答

什么是AI离线数字人生成服务？

答案：AI离线数字人生成服务是一种利用人工智能技术，通过计算机图形学、深度学习等手段，为用户提供快速、高效、定制化的数字人生成服务。用户可以通过离线方式，简单的输入（如照片或视频），快速生成高质量的2D或3D数字人形象，适用于多种应用场景。

AI离线数字人生成服务的核心功能有哪些？

核心功能包括通过AI技术快速从照片生成3D数字人、利用视频采集生成2D数字人、实时渲染与智能交互、提供定制化服务以及离线API接口接入。

AI离线数字人生成服务的核心优势是什么？

核心优势包括高效快速的离线处理、高度逼真的数字人形象生成、强大的定制化离线服务、易于集成的离线API接口以及广泛的应用场景。

在哪些场景会用到AI离线数字人生成服务？

应用场景包括媒体行业、金融行业、教育行业、娱乐行业等，用于新闻播报、天气预报、综艺节目、虚拟客服、虚拟教师、虚拟偶像或角色等数字人的应用。

如何调用AI离线数字人生成服务的API接口？

通常通过Restful风格的API接口进行离线调用，使用公网HTTP协议实现程序的自动化交互。具体的接口调用方式和参数说明，需要参考服务提供商的详细文档。

如何创建图片数字人？

通过调用创建图片数字人的离线API接口，可以基于图片创建数字人形象，然后进行视频合成或其他交互。

AI离线数字人生成服务支持哪些语音和视觉的多模态表达？

集成自然语言理解算法，根据播报的内容智能驱动数字人表情和动作，实现语音、表情、手势动作的多模态表达，所有操作均可在离线环境下完成。

使用AI离线数字人生成服务时，如何保护数据隐私？

在生成和使用AI数字人的过程中，尤其是在离线环境下，要严格保护用户的隐私和数据安全，避免数据泄露或未经授权的使用。

AI离线数字人生成服务在教育领域的应用有哪些？

AI数字人可以作为智能教育助手，为学生提供个性化的学习辅导，提高学习效果。此外，还可以作为虚拟教师，辅助教学活动或提供学习资源，所有这些应用都可以在离线环境中实现。

关于我们

新华智云科技有限公司

企业

元卯AIGC是一家专注于AIGC（人工智能生成内容）技术的公司，提供包括数字人和数字内容在内的元宇宙数字场景服务。公司通过定制形象的数字人技术，实现轻松播报，同时提供视频API等数字内容服务，致力于推动人工智能技术在内容创作和传播领域的应用。

联系信息

服务时间： 0:00 - 24:00

网页在线客服：咨询

虚拟数字人是指存在于非物理世界中，基于计算机图形学、图形渲染、动作捕捉、深度学习、语音合成、人像建模等人工智能技术，创造出来的一个可供真人或计算机驱动的形象实体，具有对物理世界的感知、认知与表达能力，以电子屏、VR、AR等设备为载体，实现人机交互；通过其面向媒体、金融、会议、文旅、娱乐、教育、医疗等行业，提供全新智能型服务，降低人力成本，提升服务质量和效率。在技术层面，虚拟数字人可被分为真人灵活驱动型和基于深度学习算法，智能驱动型两类。新华智云自主研发了真人驱动和智能驱动数字人技术，结合深度学习神经网络和计算机图形学，深度钻研声音或视觉信息到面部及身体动作的建模和渲染，让计算机能够理解语音和图像的内容并以此精细驱动数字人形象的口唇、面部表情、头部乃至全身的动作，生成极具逼真感的数字人视频，进而实现AI驱动数字人的内容生产链路。同时，新华智云数字人技术全方位覆盖了包含2D仿真人数字人、2D卡通数字人、3D卡通数字人、3D写实数字人等各个类型的数字人创造链路。作为“懂内容的技术公司”，新华智云将数字人技术与专业视频编辑系统相结合，推出数字人大厅这款虚拟数字人的视频编辑与生产平台，为内容生产者提供涉及数字人相关的内容采集、编辑、存储、分发等全生产链的专有技术。在国内乃至全球的数字人技术领域新华智云数字人技术都处于领先地位。早在2019年6月我方产品已经投入市场使用。目前已经有超过280家国内机构、覆盖了22个省、使用我方数字人产品，市场成熟度高、并已应用在媒体、文旅、会展、金融等领域。

最可能同场景使用的其他API

明星图像识别-天行数据专用API

【更新时间：2024.07.15】该服务名为“明星图像识别”，其主要功能是进行明星人物图像的识别与查询。它能够快速且准确地对输入的明星图像进行分析，帮助用户便捷地获取相关明星的具体信息，为用户提供高效的明星图像识别服务体验。

智能识别 > 图文识别

201

图像内容审核通用API

【更新时间：2024.07.15】图像内容审核服务利用AI技术自动识别和过滤图像中的不适宜内容，保障网络环境健康，提高审核效率和准确性。

安全服务 > 业务安全

587

情感倾向分析通用API 免费

【更新时间：2024.07.15】情感倾向分析API服务是一种基于人工智能技术的工具，用于自动识别和量化文本数据（如社交媒体帖子、产品评论、新闻文章等）中蕴含的情感色彩

AI技术 > AI对话

1.1K

Azure 机器学习专用API 免费

【更新时间：2024.07.15】Azure 机器学习服务，可实现在选定的平台上进行 R 和 Python 模型的开发以及运行。它提供强大的功能支持，让用户能便捷、高效地开展相关工作，无论是模型创建还是后续的运行操作，都能轻松完成。

AI技术 > AI+

210

区块链交易信息服务-Blockchain 专用API

【更新时间：2024.07.15】区块链交易信息服务-Blockchain利用 Websocket API 接收市场数据并与交易系统实时交互。每条消息都以 JSON 格式出现，交易消息使用 FIX 标准来命名字段和消息类型。

区块链技术 > 数字交易

使用指南

开发者入门指南：离线数字人API

1. 概述

离线数字人API支持2D仿真和3D写实数字人合成服务。本文档将指导开发者如何使用该API，包括接口调用、参数说明和常见错误处理。

2. 域名及请求加签

请求地址: https://api.shuwen.com
请求方式: GET/POST
接口路径示例: /open/digitalMan/pageQuery?pageNo=1&pageSize=10

3. 数字人列表查询接口

3.1 接口调用

请求方式: GET
请求路径: /open/digitalMan/pageQuery
请求参数:
- pageNo (必填): Integer, 分页页码
- pageSize (必填): Integer, 分页大小

3.2 接口结果

返回数据结构:
- total: 数据总量
- data: 数字人信息数组
  - id: 数字人ID
  - name: 名称
  - description: 描述
  - preImg: 预览图

4. 数字人详情查询接口

4.1 接口调用

请求方式: GET
请求路径: /open/digitalMan/detaiQuery/
请求参数: 数字人ID（必填）

4.2 接口结果

返回数据结构包括:
- voices: 数字人声音信息
- clothes: 数字人服饰信息

5. 数字人合成相关接口

5.1 合成接口调用

请求方式: POST
请求路径: /open/digitalMan/batch/generate

请求参数:

{
  "generateParam": [
    {
      "algoParam": {
        "video": {},
        "background": "背景图URL",
        "tts": {
          "text": "合成文本",
          "per": "声音ID"
        },
        "position": [0, 0, 1080, 1801],
        "code": "数字人编码",
        "is_green": true,
        "subtitle": true
      }
    }
  ],
  "callBackUrl": "回调地址"
}

5.2 合成接口结果

返回任务的 groupId

5.3 合成任务查询接口

请求方式: GET
请求路径: /open/digitalMan/batch/query/
请求参数: groupId

5.4 合成任务结果返回

返回数据包括:
- status: 当前子任务合成状态
- composeUrl: 合成视频的URL
- textSegs: 播报内容的相关信息

5.5 异步回调方式

客户端需根据签名验证回调请求的合法性。

6. 字幕文件生成

6.1 接口调用

请求方式: POST
请求路径: /open/digitalMan/subtitle/generate
请求参数:
- taskId: 任务ID
- type: 字幕类型（可选，默认srt）

6.2 合成结果

返回字幕文件的URL

7. 常见错误码

SW-DM-1000: 合成任务创建失败
SW-DM-1001: 租户ID缺失
SW-DM-1002: 主参数缺失
SW-DM-1003: generateParam参数缺失
SW-DM-1004: algoParam参数缺失
SW-DM-1005: 数字人形象code参数缺失
SW-DM-1006: tts参数缺失

8. 结语

通过以上步骤，开发者可以快速上手新华智云离线数字人API，进行数字人的查询和合成。请根据实际需求调整参数和请求方式，确保接口调用的成功。

指南详情链接：https://aigc.shuwen.com/docs/zh-cn/human/real.html

依赖服务

产品问答

什么是AI离线数字人生成服务？

AI离线数字人生成服务的核心功能有哪些？

核心功能包括通过AI技术快速从照片生成3D数字人、利用视频采集生成2D数字人、实时渲染与智能交互、提供定制化服务以及离线API接口接入。

AI离线数字人生成服务的核心优势是什么？

核心优势包括高效快速的离线处理、高度逼真的数字人形象生成、强大的定制化离线服务、易于集成的离线API接口以及广泛的应用场景。

在哪些场景会用到AI离线数字人生成服务？

如何调用AI离线数字人生成服务的API接口？

如何创建图片数字人？

通过调用创建图片数字人的离线API接口，可以基于图片创建数字人形象，然后进行视频合成或其他交互。

AI离线数字人生成服务支持哪些语音和视觉的多模态表达？

集成自然语言理解算法，根据播报的内容智能驱动数字人表情和动作，实现语音、表情、手势动作的多模态表达，所有操作均可在离线环境下完成。

使用AI离线数字人生成服务时，如何保护数据隐私？

在生成和使用AI数字人的过程中，尤其是在离线环境下，要严格保护用户的隐私和数据安全，避免数据泄露或未经授权的使用。

AI离线数字人生成服务在教育领域的应用有哪些？

关于我们

新华智云科技有限公司

企业

联系信息

服务时间： 0:00 - 24:00

网页在线客服：咨询

最可能同场景使用的其他API

明星图像识别-天行数据专用API

智能识别 > 图文识别

201

图像内容审核通用API

【更新时间：2024.07.15】图像内容审核服务利用AI技术自动识别和过滤图像中的不适宜内容，保障网络环境健康，提高审核效率和准确性。

安全服务 > 业务安全

587

情感倾向分析通用API 免费

AI技术 > AI对话

1.1K

Azure 机器学习专用API 免费

AI技术 > AI+

210

区块链交易信息服务-Blockchain 专用API

区块链技术 > 数字交易

AI离线数字人生成服务-AIGC

什么是AIGC的AI离线数字人生成服务?

AIGC的AI离线数字人生成服务有哪些核心功能？

AIGC的AI离线数字人生成服务的核心优势是什么？

在哪些场景会用到AIGC的AI离线数字人生成服务？

1. 媒体行业：虚拟主播制作

2. 金融行业：虚拟客服与顾问

3. 教育行业：虚拟教师与助教

2. 娱乐行业：虚拟偶像与角色

开发者入门指南：离线数字人API

1. 概述

2. 域名及请求加签

3. 数字人列表查询接口

3.1 接口调用

3.2 接口结果

4. 数字人详情查询接口

4.1 接口调用

4.2 接口结果

5. 数字人合成相关接口

5.1 合成接口调用

5.2 合成接口结果

5.3 合成任务查询接口

5.4 合成任务结果返回

5.5 异步回调方式

6. 字幕文件生成

6.1 接口调用

6.2 合成结果

7. 常见错误码

8. 结语

开发者入门指南：离线数字人API

1. 概述

2. 域名及请求加签

3. 数字人列表查询接口

3.1 接口调用

3.2 接口结果

4. 数字人详情查询接口

4.1 接口调用

4.2 接口结果

5. 数字人合成相关接口

5.1 合成接口调用

5.2 合成接口结果

5.3 合成任务查询接口

5.4 合成任务结果返回

5.5 异步回调方式

6. 字幕文件生成

6.1 接口调用

6.2 合成结果

7. 常见错误码

8. 结语

API平台

API平台

API学院

公司