阿里云语音分析服务

阿里云语音分析服务

专用API
【更新时间: 2024.08.14】 阿里云语音分析服务是一款专为满足开发者对语音数据处理需求而设计的数据与API产品。该服务旨在帮助企业快速构建语音识别、情感分析、关键词提取等多种语音处理能力,无需从头开始构建复杂的语音处理系统。
30千次 / 50.00年起 去服务商官网采购>
浏览次数
24
采购人数
0
试用次数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是阿里云语音分析服务?

语音分析技术是指通过检测与分析音频,识别特定语音分类的技术,包括说话人识别、语种识别、性别识别、声音事件检测等技术,可应用于会议音频识别、客服音频分析或音视频剪辑等场景。

什么是阿里云语音分析服务接口?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用阿里云语音分析服务,从而实现程序的自动化交互,提高服务效率。

阿里云语音分析服务有哪些核心功能?

1. 语种识别
实现对上传音频(实时或离线)中所说的是哪种语言进行句级别的判定,并返回是中、英、粤语或其他语言。

2. 性别识别
通过对上传音频(实时或离线)进行高效解析,有效判定说话人的性别(男女)以及年龄段(儿童、成年、老人)。

3. 声音事件检测
通过一段声音来对环境音(包括语音、短视频等)里面的事件类型进行检测分类,其主要任务是检测识别音频中诸如背景音乐、哭声、笑声、爆炸声之类的声音,并标注出声音的起止时间。

4. 说话人识别
基于自研声纹识别算法,通过解析一段语音,将提取到的音频特征与之前注册的音频特征进行比对,来对说话人身份进行核验(类似人脸识别)。

阿里云语音分析服务的核心优势是什么?

1. 易接入
支持HTTP&SDK多种技术接入,各类平台适用,支持本地化部署
2. 速度快
可批量对音频进行识别并快速返回结果
3. 领域广
可应用于多种场景如电话客服、手机应用等

在哪些场景会用到阿里云语音分析服务?

1. 跨国会议场景
由于跨国会议往往涉及到多个国家人群的对话,基于用户上传的声音进行分析可以自动选择不同识别模型提升会议识别率。
3. 音视频剪辑
视频后期工作者往往要面对海量的剪辑工作,通过此功能可轻松定位不同事件位置,极大提升了剪辑效率。
2. 外呼营销场景
通过对一句话内有效音频识别出用户性别,以便更好地提供人性化语音交互服务,提升客户体验。
4. 金融风控场景
说话人识别从1:1身份确认到1:N身份辨认,为金融定制精准高效的客户身份安全验证。
<
产品价格
>

<
使用指南
>

入门流程

快速入门文档介绍使用智能语音服务需要的步骤,帮助您快速开通服务、创建测试项目和调用语音服务。

image

步骤1:准备账号

  1. 注册阿里云账号。

    阿里云账号作为阿里云系统识别的资源消费账户,有阿里云所有产品和管理权限。具体操作,请参见注册阿里云账号

  2. 个人实名认证。

    为了确保您可以正常使用阿里云产品和服务,您需要完成个人实名认证。具体操作,请参见个人实名认证

  3. (可选)创建并授权RAM用户。

    当您的企业存在多用户协同访问资源的场景时,可以创建RAM用户,使用RAM可以按需为用户分配最小权限,避免多用户共享阿里云账号密码或访问密钥,从而降低企业的安全风险。具体操作,请参见创建RAM用户。关于RAM用户的更多信息,请参见什么是访问控制

    如果使用RAM用户调用智能语音交互产品,请前往控制台为RAM用户授予AliyunNLSFullAccess权限。具体操作,请参见为RAM用户授权

    RAM授权

    说明

    创建RAM用户时,请设置登录密码,否则无法单独登录RAM账号。

步骤2:创建AccessKey

在调用阿里云API时您需要使用AccessKey完成身份验证,AccessKey包括AccessKey ID和AccessKey Secret,具体说明如下:

  • AccessKey ID:用于标识用户。

  • AccessKey Secret:用于验证用户的密钥。AccessKey Secret必须保密。

创建阿里云账号的AccessKey

登录RAM访问控制台,使用阿里云账号创建AccessKey。具体操作,请参见创建AccessKey

image

创建RAM用户的AccessKey

使用阿里云账号登录RAM访问控制台,为RAM用户创建AccessKey。具体操作,请参见创建AccessKey

重要

RAM用户的AccessKey Secret只在创建时显示,不支持查看,请妥善保管。

image

步骤3:开通服务

如果您是第一次使用智能语音交互,推荐您使用阿里云账号开通智能语音交互服务。

进入智能语音交互产品首页,单击开通并购买,然后在产品开通页面,选择服务类型并选中服务协议,单击立即开通,即可开通智能语音交互服务。

类型

说明

免费试用版

默认全部试用。长文本语音合成、录音文件识别(闲时版)和录音文件识别(极速版)无试用版。

新开通服务的用户可免费试用3个月,支持2路并发(即同时最大2个任务)或每日2小时的录音文件识别额度。

重要

新用户试用期3个月内,每隔24小时可免费识别2小时时长的文件转写服务。免费额度用完后,间隔24小时后可继续试用。

商用版

选择某个或多个语音服务为商用,开通后按量计费,根据实际使用量从您的阿里云账户余额中扣费。更多信息,请参见计费说明

立即开通

步骤4:管理项目

登录智能语音交互控制台,创建项目生成对应的Appkey。具体操作,请参见管理项目

步骤5:获取Token

访问令牌( Token)是调用智能语音交互服务的服务鉴权凭证。

Token在不同项目间、不同进程间、不同线程间都可以共用,Token有效期根据服务端返回为准,过期前必须提前重新获取Token,建议每天重新获取。为了安全起见,建议您在服务端集成Token SDK,客户端从服务端获取Token。

获取Token方式

建议使用场景

通过控制台获取Token

仅供测试使用,在控制台获取Token。

获取Token

正式环境使用,通过传入AccessKey ID和AccessKey Secret,在SDK通过代码定期自动获取Token。

通过OpenAPI获取Token

若对应的编程语言缺少SDK,或者需要控制依赖组件,可以通过OpenAPI获取Token。

步骤6:集成开发

根据以上几步获取到账号对应的AccessKey IDAccessKey Secret服务鉴权Token、以及项目Appkey,必须确保这几项数值归属于同一阿里云账号或同一RAM用户。

您可以根据以上信息,通过命令行等方式快速体验智能语音交互产品能力,具体操作,请参见运行示例。也可以通过SDK和API概览详细了解在各类平台如何将语音识别语音合成功能集成到您的服务当中。

集成运行

说明

集成运行

说明

运行示例

基于使用阿里云主账号且从控制台获取测试Token来体验产品。

主要通过控制台、curl命令行、postman、以及Java SDK等方式快速体验智能语音交互能力。

SDK和API概览

RESTful API、移动端、服务端、微信小程序以及WebSocket等多种接入方式。

<
产品问答
>
?
什么是并发?
智能语音交互产品中的并发,是指系统同时处理的请求数。 以实时语音转写为例,每当发起一个请求后(比如调用start接口),即为建立一个WebSocket链接, 在请求结束之前(比如调用stop或close接口),该请求一直占用一个并发。如果您的并发额度是200,即同时只能建立200个类似的实时转写请求,如果超出额度会返回错误码40000005。
?
什么是QPS?
QPS是指每秒能够处理的请求数。 以录音文件识别(含闲时版)为例,QPS限制是指您每秒最多调用的请求数, 如果超过QPS限制,可能会报出Throttling.User : Request was denied due to user flow control.类似的错误。 建议您适当调整提交任务、查询任务接口的调用频率。
?
刚刚购买了资源包,为什么控制台上显示不出来?
如果当日购买资源包,在次日(T+1) 才会在控制台上显示余量。
<
关于我们
>
丰富的企业应用,满足企业经营和数字化所需 安全合规 亚太合规资质最全的云服务商之一,从基础设施安全、内核平台安全、系统服务安全、云安全产品四个层面,保障千行百业客户的业务安全在线。拥有权威认可的原生安全能力,根据2021年Gartner报告,安全能力全球第一。 技术领先 飞天是阿里云自主研发、国内唯一自研的云计算操作系统,编排调度百万级服务器,单集群调度规模超十万台,具备EB级数据存储能力,并通过CIPU率先实现虚拟化“0”损耗,提供业界领先的计算性能,既满足客户严苛的业务要求,又提供高性价比服务。
联系信息
服务时间: 7*24
电话号码: 86 571 8502 2600

<
最可能同场景使用的其他API
>
API接口列表
<
产品价格
>

<
使用指南
>

入门流程

快速入门文档介绍使用智能语音服务需要的步骤,帮助您快速开通服务、创建测试项目和调用语音服务。

image

步骤1:准备账号

  1. 注册阿里云账号。

    阿里云账号作为阿里云系统识别的资源消费账户,有阿里云所有产品和管理权限。具体操作,请参见注册阿里云账号

  2. 个人实名认证。

    为了确保您可以正常使用阿里云产品和服务,您需要完成个人实名认证。具体操作,请参见个人实名认证

  3. (可选)创建并授权RAM用户。

    当您的企业存在多用户协同访问资源的场景时,可以创建RAM用户,使用RAM可以按需为用户分配最小权限,避免多用户共享阿里云账号密码或访问密钥,从而降低企业的安全风险。具体操作,请参见创建RAM用户。关于RAM用户的更多信息,请参见什么是访问控制

    如果使用RAM用户调用智能语音交互产品,请前往控制台为RAM用户授予AliyunNLSFullAccess权限。具体操作,请参见为RAM用户授权

    RAM授权

    说明

    创建RAM用户时,请设置登录密码,否则无法单独登录RAM账号。

步骤2:创建AccessKey

在调用阿里云API时您需要使用AccessKey完成身份验证,AccessKey包括AccessKey ID和AccessKey Secret,具体说明如下:

  • AccessKey ID:用于标识用户。

  • AccessKey Secret:用于验证用户的密钥。AccessKey Secret必须保密。

创建阿里云账号的AccessKey

登录RAM访问控制台,使用阿里云账号创建AccessKey。具体操作,请参见创建AccessKey

image

创建RAM用户的AccessKey

使用阿里云账号登录RAM访问控制台,为RAM用户创建AccessKey。具体操作,请参见创建AccessKey

重要

RAM用户的AccessKey Secret只在创建时显示,不支持查看,请妥善保管。

image

步骤3:开通服务

如果您是第一次使用智能语音交互,推荐您使用阿里云账号开通智能语音交互服务。

进入智能语音交互产品首页,单击开通并购买,然后在产品开通页面,选择服务类型并选中服务协议,单击立即开通,即可开通智能语音交互服务。

类型

说明

免费试用版

默认全部试用。长文本语音合成、录音文件识别(闲时版)和录音文件识别(极速版)无试用版。

新开通服务的用户可免费试用3个月,支持2路并发(即同时最大2个任务)或每日2小时的录音文件识别额度。

重要

新用户试用期3个月内,每隔24小时可免费识别2小时时长的文件转写服务。免费额度用完后,间隔24小时后可继续试用。

商用版

选择某个或多个语音服务为商用,开通后按量计费,根据实际使用量从您的阿里云账户余额中扣费。更多信息,请参见计费说明

立即开通

步骤4:管理项目

登录智能语音交互控制台,创建项目生成对应的Appkey。具体操作,请参见管理项目

步骤5:获取Token

访问令牌( Token)是调用智能语音交互服务的服务鉴权凭证。

Token在不同项目间、不同进程间、不同线程间都可以共用,Token有效期根据服务端返回为准,过期前必须提前重新获取Token,建议每天重新获取。为了安全起见,建议您在服务端集成Token SDK,客户端从服务端获取Token。

获取Token方式

建议使用场景

通过控制台获取Token

仅供测试使用,在控制台获取Token。

获取Token

正式环境使用,通过传入AccessKey ID和AccessKey Secret,在SDK通过代码定期自动获取Token。

通过OpenAPI获取Token

若对应的编程语言缺少SDK,或者需要控制依赖组件,可以通过OpenAPI获取Token。

步骤6:集成开发

根据以上几步获取到账号对应的AccessKey IDAccessKey Secret服务鉴权Token、以及项目Appkey,必须确保这几项数值归属于同一阿里云账号或同一RAM用户。

您可以根据以上信息,通过命令行等方式快速体验智能语音交互产品能力,具体操作,请参见运行示例。也可以通过SDK和API概览详细了解在各类平台如何将语音识别语音合成功能集成到您的服务当中。

集成运行

说明

集成运行

说明

运行示例

基于使用阿里云主账号且从控制台获取测试Token来体验产品。

主要通过控制台、curl命令行、postman、以及Java SDK等方式快速体验智能语音交互能力。

SDK和API概览

RESTful API、移动端、服务端、微信小程序以及WebSocket等多种接入方式。

<
依赖服务
>
<
产品问答
>
?
什么是并发?
智能语音交互产品中的并发,是指系统同时处理的请求数。 以实时语音转写为例,每当发起一个请求后(比如调用start接口),即为建立一个WebSocket链接, 在请求结束之前(比如调用stop或close接口),该请求一直占用一个并发。如果您的并发额度是200,即同时只能建立200个类似的实时转写请求,如果超出额度会返回错误码40000005。
?
什么是QPS?
QPS是指每秒能够处理的请求数。 以录音文件识别(含闲时版)为例,QPS限制是指您每秒最多调用的请求数, 如果超过QPS限制,可能会报出Throttling.User : Request was denied due to user flow control.类似的错误。 建议您适当调整提交任务、查询任务接口的调用频率。
?
刚刚购买了资源包,为什么控制台上显示不出来?
如果当日购买资源包,在次日(T+1) 才会在控制台上显示余量。
<
关于我们
>
丰富的企业应用,满足企业经营和数字化所需 安全合规 亚太合规资质最全的云服务商之一,从基础设施安全、内核平台安全、系统服务安全、云安全产品四个层面,保障千行百业客户的业务安全在线。拥有权威认可的原生安全能力,根据2021年Gartner报告,安全能力全球第一。 技术领先 飞天是阿里云自主研发、国内唯一自研的云计算操作系统,编排调度百万级服务器,单集群调度规模超十万台,具备EB级数据存储能力,并通过CIPU率先实现虚拟化“0”损耗,提供业界领先的计算性能,既满足客户严苛的业务要求,又提供高性价比服务。
联系信息
服务时间: 7*24
电话号码: 86 571 8502 2600

<
最可能同场景使用的其他API
>