阿里云语音分析服务

专用API

服务商：阿里云计算有限公司

【更新时间: 2024.08.14】阿里云语音分析服务是一款专为满足开发者对语音数据处理需求而设计的数据与API产品。该服务旨在帮助企业快速构建语音识别、情感分析、关键词提取等多种语音处理能力，无需从头开始构建复杂的语音处理系统。

30千次 / 50.00年起去服务商官网采购>

浏览次数

采购人数

试用次数

SLA: N/A

响应: N/A

适用于个人&企业

书签名称

确定

相似API

Text to Speech

130

使用该API可以将任何文字转语音，文字到语音使机器和应用程序能够说话。文本转语音支持多种语言，文本到语音实现语音生成。

MicrosoftAzure智能无广告位置搜寻

Microsoft Azure的一项人工智能服务，为您的用户提供安全、无广告的位置搜索，显示来自网络结果、图像、本地企业、新闻和图像的相关信息照片。

Amazon 语音转文本-Transcribe

Amazon Transcribe 使用一种称为自动语音识别 (ASR) 的深度学习过程，快速准确地将语音转换为文本。

API详情
定价
使用指南
常见 FAQ
关于我们
相关推荐

产品介绍

什么是阿里云语音分析服务?

语音分析技术是指通过检测与分析音频，识别特定语音分类的技术，包括说话人识别、语种识别、性别识别、声音事件检测等技术，可应用于会议音频识别、客服音频分析或音视频剪辑等场景。

什么是阿里云语音分析服务接口？

由服务使用方的应用程序发起，以Restful风格为主、通过公网HTTP协议调用阿里云语音分析服务，从而实现程序的自动化交互，提高服务效率。

阿里云语音分析服务有哪些核心功能？

1. 语种识别
实现对上传音频（实时或离线）中所说的是哪种语言进行句级别的判定，并返回是中、英、粤语或其他语言。

2. 性别识别
通过对上传音频（实时或离线）进行高效解析，有效判定说话人的性别（男女）以及年龄段（儿童、成年、老人）。

3. 声音事件检测
通过一段声音来对环境音（包括语音、短视频等）里面的事件类型进行检测分类，其主要任务是检测识别音频中诸如背景音乐、哭声、笑声、爆炸声之类的声音，并标注出声音的起止时间。

4. 说话人识别
基于自研声纹识别算法，通过解析一段语音，将提取到的音频特征与之前注册的音频特征进行比对，来对说话人身份进行核验（类似人脸识别）。

阿里云语音分析服务的核心优势是什么？


1. 易接入支持HTTP&SDK多种技术接入，各类平台适用，支持本地化部署	2. 速度快可批量对音频进行识别并快速返回结果	3. 领域广可应用于多种场景如电话客服、手机应用等

在哪些场景会用到阿里云语音分析服务？

1. 跨国会议场景由于跨国会议往往涉及到多个国家人群的对话，基于用户上传的声音进行分析可以自动选择不同识别模型提升会议识别率。		3. 音视频剪辑视频后期工作者往往要面对海量的剪辑工作，通过此功能可轻松定位不同事件位置，极大提升了剪辑效率。
	2. 外呼营销场景通过对一句话内有效音频识别出用户性别，以便更好地提供人性化语音交互服务，提升客户体验。		4. 金融风控场景说话人识别从1:1身份确认到1:N身份辨认,为金融定制精准高效的客户身份安全验证。

产品价格

适用范围：

个人&企业

免费方式：

不提供

定价方式：

商务咨询

价格：

30千次 / 50.00年起

价格详情：

使用指南

入门流程

快速入门文档介绍使用智能语音服务需要的步骤，帮助您快速开通服务、创建测试项目和调用语音服务。

步骤1：准备账号

注册阿里云账号。

阿里云账号作为阿里云系统识别的资源消费账户，有阿里云所有产品和管理权限。具体操作，请参见注册阿里云账号。
个人实名认证。

为了确保您可以正常使用阿里云产品和服务，您需要完成个人实名认证。具体操作，请参见个人实名认证。
（可选）创建并授权RAM用户。

当您的企业存在多用户协同访问资源的场景时，可以创建RAM用户，使用RAM可以按需为用户分配最小权限，避免多用户共享阿里云账号密码或访问密钥，从而降低企业的安全风险。具体操作，请参见创建RAM用户。关于RAM用户的更多信息，请参见什么是访问控制。

如果使用RAM用户调用智能语音交互产品，请前往控制台为RAM用户授予AliyunNLSFullAccess权限。具体操作，请参见为RAM用户授权。

说明

创建RAM用户时，请设置登录密码，否则无法单独登录RAM账号。

步骤2：创建AccessKey

在调用阿里云API时您需要使用AccessKey完成身份验证，AccessKey包括AccessKey ID和AccessKey Secret，具体说明如下：

AccessKey ID：用于标识用户。
AccessKey Secret：用于验证用户的密钥。AccessKey Secret必须保密。

创建阿里云账号的AccessKey

登录RAM访问控制台，使用阿里云账号创建AccessKey。具体操作，请参见创建AccessKey。

创建RAM用户的AccessKey

使用阿里云账号登录RAM访问控制台，为RAM用户创建AccessKey。具体操作，请参见创建AccessKey。

重要

RAM用户的AccessKey Secret只在创建时显示，不支持查看，请妥善保管。

步骤3：开通服务

如果您是第一次使用智能语音交互，推荐您使用阿里云账号开通智能语音交互服务。

进入智能语音交互产品首页，单击开通并购买，然后在产品开通页面，选择服务类型并选中服务协议，单击立即开通，即可开通智能语音交互服务。

类型

说明

免费试用版

默认全部试用。长文本语音合成、录音文件识别（闲时版）和录音文件识别（极速版）无试用版。

新开通服务的用户可免费试用3个月，支持2路并发（即同时最大2个任务）或每日2小时的录音文件识别额度。

重要

新用户试用期3个月内，每隔24小时可免费识别2小时时长的文件转写服务。免费额度用完后，间隔24小时后可继续试用。

商用版

选择某个或多个语音服务为商用，开通后按量计费，根据实际使用量从您的阿里云账户余额中扣费。更多信息，请参见计费说明。

立即开通

步骤4：管理项目

登录智能语音交互控制台，创建项目生成对应的Appkey。具体操作，请参见管理项目。

步骤5：获取Token

访问令牌（ Token）是调用智能语音交互服务的服务鉴权凭证。

Token在不同项目间、不同进程间、不同线程间都可以共用，Token有效期根据服务端返回为准，过期前必须提前重新获取Token，建议每天重新获取。为了安全起见，建议您在服务端集成Token SDK，客户端从服务端获取Token。

获取Token方式	建议使用场景
通过控制台获取Token	仅供测试使用，在控制台获取Token。
获取Token	正式环境使用，通过传入AccessKey ID和AccessKey Secret，在SDK通过代码定期自动获取Token。
通过OpenAPI获取Token	若对应的编程语言缺少SDK，或者需要控制依赖组件，可以通过OpenAPI获取Token。

步骤6：集成开发

根据以上几步获取到账号对应的AccessKey ID、AccessKey Secret、服务鉴权Token、以及项目Appkey，必须确保这几项数值归属于同一阿里云账号或同一RAM用户。

您可以根据以上信息，通过命令行等方式快速体验智能语音交互产品能力，具体操作，请参见运行示例。也可以通过SDK和API概览详细了解在各类平台如何将语音识别或语音合成功能集成到您的服务当中。

集成运行	说明

集成运行

说明

运行示例

基于使用阿里云主账号且从控制台获取测试Token来体验产品。

主要通过控制台、curl命令行、postman、以及Java SDK等方式快速体验智能语音交互能力。

SDK和API概览

RESTful API、移动端、服务端、微信小程序以及WebSocket等多种接入方式。

产品问答

什么是并发？

智能语音交互产品中的并发，是指系统同时处理的请求数。以实时语音转写为例，每当发起一个请求后（比如调用start接口），即为建立一个WebSocket链接，在请求结束之前（比如调用stop或close接口），该请求一直占用一个并发。如果您的并发额度是200，即同时只能建立200个类似的实时转写请求，如果超出额度会返回错误码40000005。

什么是QPS？

QPS是指每秒能够处理的请求数。以录音文件识别（含闲时版）为例，QPS限制是指您每秒最多调用的请求数，如果超过QPS限制，可能会报出Throttling.User : Request was denied due to user flow control.类似的错误。建议您适当调整提交任务、查询任务接口的调用频率。

刚刚购买了资源包，为什么控制台上显示不出来？

如果当日购买资源包，在次日（T+1) 才会在控制台上显示余量。

关于我们

阿里云计算有限公司

企业

丰富的企业应用，满足企业经营和数字化所需安全合规亚太合规资质最全的云服务商之一，从基础设施安全、内核平台安全、系统服务安全、云安全产品四个层面，保障千行百业客户的业务安全在线。拥有权威认可的原生安全能力，根据2021年Gartner报告，安全能力全球第一。技术领先飞天是阿里云自主研发、国内唯一自研的云计算操作系统，编排调度百万级服务器，单集群调度规模超十万台，具备EB级数据存储能力，并通过CIPU率先实现虚拟化“0”损耗，提供业界领先的计算性能，既满足客户严苛的业务要求，又提供高性价比服务。

联系信息

服务时间： 7*24

电话号码： 86 571 8502 2600

最可能同场景使用的其他API

长语音转写-有道专用API

【更新时间：2024.08.14】长语音转写服务，能够针对一小时以内的长语音文件进行高效转换，将其准确地转写为文本数据。该服务操作便捷，能快速且精准地实现长语音到文本的转换过程，为用户提供可靠的语音转写支持。

开发者工具 > 音频工具

刷脸支付-易生支付专用API

【更新时间：2024.08.14】刷脸支付是一种以AI人脸识别为核心的新型支付方式。人脸识别是百一种基于人的相貌特征信息进行身份认证的生物特征识别度技术，技术的最大特征是能避免个人信息泄露，并采用非接触的方式进行识别。

支付服务 > 聚合支付

情感倾向分析通用API 免费

【更新时间：2024.08.14】情感倾向分析API服务是一种基于人工智能技术的工具，用于自动识别和量化文本数据（如社交媒体帖子、产品评论、新闻文章等）中蕴含的情感色彩

AI技术 > AI对话

867

Azure 机器学习专用API 免费

【更新时间：2024.08.14】Azure 机器学习服务，可实现在选定的平台上进行 R 和 Python 模型的开发以及运行。它提供强大的功能支持，让用户能便捷、高效地开展相关工作，无论是模型创建还是后续的运行操作，都能轻松完成。

AI技术 > AI+

157

多语言文本翻译-APILayer 专用API 免费

【更新时间：2024.08.14】多语言文本翻译接口-APILayer，其能够实现 47 种语言文本翻译。它可以将任何给定的文本从这 47 种语言中进行相互翻译，精准且高效，能很好地满足不同场景下对多语言文本翻译的需求，带来极大的便利。

生活服务 > 语言翻译

545

产品价格

适用范围：

个人&企业

免费方式：

不提供

定价方式：

商务咨询

价格：

30千次 / 50.00年起

价格详情：

使用指南

入门流程

快速入门文档介绍使用智能语音服务需要的步骤，帮助您快速开通服务、创建测试项目和调用语音服务。

步骤1：准备账号

注册阿里云账号。

阿里云账号作为阿里云系统识别的资源消费账户，有阿里云所有产品和管理权限。具体操作，请参见注册阿里云账号。
个人实名认证。

为了确保您可以正常使用阿里云产品和服务，您需要完成个人实名认证。具体操作，请参见个人实名认证。
（可选）创建并授权RAM用户。

当您的企业存在多用户协同访问资源的场景时，可以创建RAM用户，使用RAM可以按需为用户分配最小权限，避免多用户共享阿里云账号密码或访问密钥，从而降低企业的安全风险。具体操作，请参见创建RAM用户。关于RAM用户的更多信息，请参见什么是访问控制。

如果使用RAM用户调用智能语音交互产品，请前往控制台为RAM用户授予AliyunNLSFullAccess权限。具体操作，请参见为RAM用户授权。

说明

创建RAM用户时，请设置登录密码，否则无法单独登录RAM账号。

步骤2：创建AccessKey

在调用阿里云API时您需要使用AccessKey完成身份验证，AccessKey包括AccessKey ID和AccessKey Secret，具体说明如下：

AccessKey ID：用于标识用户。
AccessKey Secret：用于验证用户的密钥。AccessKey Secret必须保密。

创建阿里云账号的AccessKey

登录RAM访问控制台，使用阿里云账号创建AccessKey。具体操作，请参见创建AccessKey。

创建RAM用户的AccessKey

使用阿里云账号登录RAM访问控制台，为RAM用户创建AccessKey。具体操作，请参见创建AccessKey。

重要

RAM用户的AccessKey Secret只在创建时显示，不支持查看，请妥善保管。

步骤3：开通服务

如果您是第一次使用智能语音交互，推荐您使用阿里云账号开通智能语音交互服务。

类型

说明

免费试用版

默认全部试用。长文本语音合成、录音文件识别（闲时版）和录音文件识别（极速版）无试用版。

新开通服务的用户可免费试用3个月，支持2路并发（即同时最大2个任务）或每日2小时的录音文件识别额度。

重要

新用户试用期3个月内，每隔24小时可免费识别2小时时长的文件转写服务。免费额度用完后，间隔24小时后可继续试用。

商用版

选择某个或多个语音服务为商用，开通后按量计费，根据实际使用量从您的阿里云账户余额中扣费。更多信息，请参见计费说明。

立即开通

步骤4：管理项目

登录智能语音交互控制台，创建项目生成对应的Appkey。具体操作，请参见管理项目。

步骤5：获取Token

访问令牌（ Token）是调用智能语音交互服务的服务鉴权凭证。

获取Token方式	建议使用场景
通过控制台获取Token	仅供测试使用，在控制台获取Token。
获取Token	正式环境使用，通过传入AccessKey ID和AccessKey Secret，在SDK通过代码定期自动获取Token。
通过OpenAPI获取Token	若对应的编程语言缺少SDK，或者需要控制依赖组件，可以通过OpenAPI获取Token。

步骤6：集成开发

集成运行	说明

集成运行

说明

运行示例

基于使用阿里云主账号且从控制台获取测试Token来体验产品。

主要通过控制台、curl命令行、postman、以及Java SDK等方式快速体验智能语音交互能力。

SDK和API概览

RESTful API、移动端、服务端、微信小程序以及WebSocket等多种接入方式。

依赖服务

产品问答

什么是并发？

什么是QPS？

刚刚购买了资源包，为什么控制台上显示不出来？

如果当日购买资源包，在次日（T+1) 才会在控制台上显示余量。

关于我们

阿里云计算有限公司

企业

联系信息

服务时间： 7*24

电话号码： 86 571 8502 2600

最可能同场景使用的其他API

长语音转写-有道专用API

开发者工具 > 音频工具

刷脸支付-易生支付专用API

支付服务 > 聚合支付

情感倾向分析通用API 免费

AI技术 > AI对话

867

Azure 机器学习专用API 免费

AI技术 > AI+

157

多语言文本翻译-APILayer 专用API 免费

生活服务 > 语言翻译

545

阿里云语音分析服务

什么是阿里云语音分析服务?

什么是阿里云语音分析服务接口？

阿里云语音分析服务有哪些核心功能？

阿里云语音分析服务的核心优势是什么？

在哪些场景会用到阿里云语音分析服务？

入门流程

步骤1：准备账号

步骤2：创建AccessKey

创建阿里云账号的AccessKey

创建RAM用户的AccessKey

步骤3：开通服务

步骤4：管理项目

步骤5：获取Token

步骤6：集成开发

入门流程

步骤1：准备账号

步骤2：创建AccessKey

创建阿里云账号的AccessKey

创建RAM用户的AccessKey

步骤3：开通服务

步骤4：管理项目

步骤5：获取Token

步骤6：集成开发

API平台

API平台

API学院

公司