阿里云视觉智能开放平台 API产品9
低延时、高并发、易接入、高清流畅、实时多媒体处理的音视频直播服务。视频直播(ApsaraVideo Live)是基于阿里云内容接入与分发网络和大规模分布式实时视频处理技术(含窄带高清)打造的音视频直播服务,为用户提供易接入、低延迟、高并发、高清流畅、实时多媒体处理的音视频直播产品。
虚拟数字人技术以AI实时渲染为核心,快速构建轻量级数字人物。依托达摩院在语音、图像、3D美术、NLP等领域的技术,提供实时交互的数字人流媒体产品、高效的视频合成服务,以及定制化的数字人资产构建。
阿里云视觉智能开放平台(Vision Intelligent Application Programming Interface Platform)简称视觉智能平台,是基于阿里巴巴视觉智能技术实践经验,面向视觉智能技术企业和开发商(含开发者),为其提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术应用能力的综合性视觉AI能力平台。
通义千问的角色扮演模型,适合拟人化的对话场景(如虚拟社交、游戏NPC、IP复刻、硬件/玩具/车机等)。相比于其它通义千问模型,提升了人设还原、话题推进、倾听共情等能力。
Qwen2.5系列数学专家72B模型,相较于 Qwen2,Qwen2.5 获得了显著更多的知识,并在编程能力和数学能力方面有了大幅提升。此外,新模型在指令执行、生成长文本、理解结构化数据(例如表格)以及生成结构化输出特别是 JSON 方面取得了显著改进。
Qwen2.5系列编程专家7B模型,相较于 Qwen2,Qwen2.5 获得了显著更多的知识,并在编程能力和数学能力方面有了大幅提升。此外,新模型在指令执行、生成长文本、理解结构化数据(例如表格)以及生成结构化输出特别是 JSON 方面取得了显著改进。
OpenNLU全称Open Domain Natural Language Understanding,是开箱即用的文本理解大模型,适用于中文、英文在零样本条件下进行文本理解任务,如信息抽取、文本分类等。