![]() |
阿里云语音分析服务
专用API
【更新时间: 2024.08.14】
阿里云语音分析服务是一款专为满足开发者对语音数据处理需求而设计的数据与API产品。该服务旨在帮助企业快速构建语音识别、情感分析、关键词提取等多种语音处理能力,无需从头开始构建复杂的语音处理系统。
30千次 / 50.00年起
去服务商官网采购>
|
浏览次数
24
采购人数
0
试用次数
0
收藏
×
完成
取消
×
书签名称
确定
|
- API详情
- 定价
- 使用指南
- 常见 FAQ
- 关于我们
- 相关推荐


什么是阿里云语音分析服务?
语音分析技术是指通过检测与分析音频,识别特定语音分类的技术,包括说话人识别、语种识别、性别识别、声音事件检测等技术,可应用于会议音频识别、客服音频分析或音视频剪辑等场景。 | ![]() |
什么是阿里云语音分析服务接口?
阿里云语音分析服务有哪些核心功能?
1. 语种识别
实现对上传音频(实时或离线)中所说的是哪种语言进行句级别的判定,并返回是中、英、粤语或其他语言。
2. 性别识别
通过对上传音频(实时或离线)进行高效解析,有效判定说话人的性别(男女)以及年龄段(儿童、成年、老人)。
3. 声音事件检测
通过一段声音来对环境音(包括语音、短视频等)里面的事件类型进行检测分类,其主要任务是检测识别音频中诸如背景音乐、哭声、笑声、爆炸声之类的声音,并标注出声音的起止时间。
4. 说话人识别
基于自研声纹识别算法,通过解析一段语音,将提取到的音频特征与之前注册的音频特征进行比对,来对说话人身份进行核验(类似人脸识别)。
阿里云语音分析服务的核心优势是什么?
![]() |
![]() |
![]() |
1. 易接入 支持HTTP&SDK多种技术接入,各类平台适用,支持本地化部署 |
2. 速度快 可批量对音频进行识别并快速返回结果 |
3. 领域广 可应用于多种场景如电话客服、手机应用等 |
在哪些场景会用到阿里云语音分析服务?
1. 跨国会议场景 由于跨国会议往往涉及到多个国家人群的对话,基于用户上传的声音进行分析可以自动选择不同识别模型提升会议识别率。 |
![]() |
3. 音视频剪辑 视频后期工作者往往要面对海量的剪辑工作,通过此功能可轻松定位不同事件位置,极大提升了剪辑效率。 |
![]() |
![]() |
2. 外呼营销场景 通过对一句话内有效音频识别出用户性别,以便更好地提供人性化语音交互服务,提升客户体验。 |
![]() |
4. 金融风控场景 说话人识别从1:1身份确认到1:N身份辨认,为金融定制精准高效的客户身份安全验证。 |




入门流程
快速入门文档介绍使用智能语音服务需要的步骤,帮助您快速开通服务、创建测试项目和调用语音服务。
步骤1:准备账号
-
注册阿里云账号。
阿里云账号作为阿里云系统识别的资源消费账户,有阿里云所有产品和管理权限。具体操作,请参见注册阿里云账号。
-
个人实名认证。
为了确保您可以正常使用阿里云产品和服务,您需要完成个人实名认证。具体操作,请参见个人实名认证。
-
(可选)创建并授权RAM用户。
当您的企业存在多用户协同访问资源的场景时,可以创建RAM用户,使用RAM可以按需为用户分配最小权限,避免多用户共享阿里云账号密码或访问密钥,从而降低企业的安全风险。具体操作,请参见创建RAM用户。关于RAM用户的更多信息,请参见什么是访问控制。
如果使用RAM用户调用智能语音交互产品,请前往控制台为RAM用户授予AliyunNLSFullAccess权限。具体操作,请参见为RAM用户授权。
步骤2:创建AccessKey
在调用阿里云API时您需要使用AccessKey完成身份验证,AccessKey包括AccessKey ID和AccessKey Secret,具体说明如下:
-
AccessKey ID:用于标识用户。
-
AccessKey Secret:用于验证用户的密钥。AccessKey Secret必须保密。
创建阿里云账号的AccessKey
登录RAM访问控制台,使用阿里云账号创建AccessKey。具体操作,请参见创建AccessKey。
创建RAM用户的AccessKey
使用阿里云账号登录RAM访问控制台,为RAM用户创建AccessKey。具体操作,请参见创建AccessKey。
步骤3:开通服务
如果您是第一次使用智能语音交互,推荐您使用阿里云账号开通智能语音交互服务。
进入智能语音交互产品首页,单击开通并购买,然后在产品开通页面,选择服务类型并选中服务协议,单击立即开通,即可开通智能语音交互服务。
类型 |
说明 |
免费试用版 |
默认全部试用。长文本语音合成、录音文件识别(闲时版)和录音文件识别(极速版)无试用版。 新开通服务的用户可免费试用3个月,支持2路并发(即同时最大2个任务)或每日2小时的录音文件识别额度。 |
商用版 |
选择某个或多个语音服务为商用,开通后按量计费,根据实际使用量从您的阿里云账户余额中扣费。更多信息,请参见计费说明。 |
步骤4:管理项目
步骤5:获取Token
访问令牌( Token)是调用智能语音交互服务的服务鉴权凭证。
Token在不同项目间、不同进程间、不同线程间都可以共用,Token有效期根据服务端返回为准,过期前必须提前重新获取Token,建议每天重新获取。为了安全起见,建议您在服务端集成Token SDK,客户端从服务端获取Token。
获取Token方式 |
建议使用场景 |
仅供测试使用,在控制台获取Token。 |
|
正式环境使用,通过传入AccessKey ID和AccessKey Secret,在SDK通过代码定期自动获取Token。 |
|
若对应的编程语言缺少SDK,或者需要控制依赖组件,可以通过OpenAPI获取Token。 |
步骤6:集成开发
根据以上几步获取到账号对应的AccessKey ID、AccessKey Secret、服务鉴权Token、以及项目Appkey,必须确保这几项数值归属于同一阿里云账号或同一RAM用户。
您可以根据以上信息,通过命令行等方式快速体验智能语音交互产品能力,具体操作,请参见运行示例。也可以通过SDK和API概览详细了解在各类平台如何将语音识别或语音合成功能集成到您的服务当中。








入门流程
快速入门文档介绍使用智能语音服务需要的步骤,帮助您快速开通服务、创建测试项目和调用语音服务。
步骤1:准备账号
-
注册阿里云账号。
阿里云账号作为阿里云系统识别的资源消费账户,有阿里云所有产品和管理权限。具体操作,请参见注册阿里云账号。
-
个人实名认证。
为了确保您可以正常使用阿里云产品和服务,您需要完成个人实名认证。具体操作,请参见个人实名认证。
-
(可选)创建并授权RAM用户。
当您的企业存在多用户协同访问资源的场景时,可以创建RAM用户,使用RAM可以按需为用户分配最小权限,避免多用户共享阿里云账号密码或访问密钥,从而降低企业的安全风险。具体操作,请参见创建RAM用户。关于RAM用户的更多信息,请参见什么是访问控制。
如果使用RAM用户调用智能语音交互产品,请前往控制台为RAM用户授予AliyunNLSFullAccess权限。具体操作,请参见为RAM用户授权。
步骤2:创建AccessKey
在调用阿里云API时您需要使用AccessKey完成身份验证,AccessKey包括AccessKey ID和AccessKey Secret,具体说明如下:
-
AccessKey ID:用于标识用户。
-
AccessKey Secret:用于验证用户的密钥。AccessKey Secret必须保密。
创建阿里云账号的AccessKey
登录RAM访问控制台,使用阿里云账号创建AccessKey。具体操作,请参见创建AccessKey。
创建RAM用户的AccessKey
使用阿里云账号登录RAM访问控制台,为RAM用户创建AccessKey。具体操作,请参见创建AccessKey。
步骤3:开通服务
如果您是第一次使用智能语音交互,推荐您使用阿里云账号开通智能语音交互服务。
进入智能语音交互产品首页,单击开通并购买,然后在产品开通页面,选择服务类型并选中服务协议,单击立即开通,即可开通智能语音交互服务。
类型 |
说明 |
免费试用版 |
默认全部试用。长文本语音合成、录音文件识别(闲时版)和录音文件识别(极速版)无试用版。 新开通服务的用户可免费试用3个月,支持2路并发(即同时最大2个任务)或每日2小时的录音文件识别额度。 |
商用版 |
选择某个或多个语音服务为商用,开通后按量计费,根据实际使用量从您的阿里云账户余额中扣费。更多信息,请参见计费说明。 |
步骤4:管理项目
步骤5:获取Token
访问令牌( Token)是调用智能语音交互服务的服务鉴权凭证。
Token在不同项目间、不同进程间、不同线程间都可以共用,Token有效期根据服务端返回为准,过期前必须提前重新获取Token,建议每天重新获取。为了安全起见,建议您在服务端集成Token SDK,客户端从服务端获取Token。
获取Token方式 |
建议使用场景 |
仅供测试使用,在控制台获取Token。 |
|
正式环境使用,通过传入AccessKey ID和AccessKey Secret,在SDK通过代码定期自动获取Token。 |
|
若对应的编程语言缺少SDK,或者需要控制依赖组件,可以通过OpenAPI获取Token。 |
步骤6:集成开发
根据以上几步获取到账号对应的AccessKey ID、AccessKey Secret、服务鉴权Token、以及项目Appkey,必须确保这几项数值归属于同一阿里云账号或同一RAM用户。
您可以根据以上信息,通过命令行等方式快速体验智能语音交互产品能力,具体操作,请参见运行示例。也可以通过SDK和API概览详细了解在各类平台如何将语音识别或语音合成功能集成到您的服务当中。





