revai语音文本理解产品

专用API

服务商： revai

【更新时间: 2024.07.31】世界上最准确的 AI 和人类生成转录本的 API。Rev AI 从世界上最多样化的声音集合中训练而来，为视频和语音应用设定了准确性标准。

咨询去服务商官网采购>

浏览次数

采购人数

试用次数

SLA: N/A

响应: N/A

适用于个人&企业

书签名称

确定

相似API

Text to Speech

164

使用该API可以将任何文字转语音，文字到语音使机器和应用程序能够说话。文本转语音支持多种语言，文本到语音实现语音生成。

MicrosoftAzure智能无广告位置搜寻

Microsoft Azure的一项人工智能服务，为您的用户提供安全、无广告的位置搜索，显示来自网络结果、图像、本地企业、新闻和图像的相关信息照片。

Amazon 语音转文本-Transcribe

132

Amazon Transcribe 使用一种称为自动语音识别 (ASR) 的深度学习过程，快速准确地将语音转换为文本。

API详情
定价
使用指南
关于我们
相关推荐

产品介绍

什么是revai语音文本理解产品?

RevAI语音文本理解产品是一种先进的技术解决方案，旨在通过深入分析音频内容来提取关键信息和洞察，从而为企业决策提供有力支持。这种产品结合了自然语言处理

（NLP）和机器学习算法，能够识别、转录并分析音频数据中的语音内容，进而生成准确的文本输出。

revai语音文本理解产品有哪些核心功能？

1.语言识别

在转录音频或视频文件之前，自动检测音频或视频文件中使用的主要语言。语言识别会获取音频文件并返回最有可能使用的语言。语言识别提供有关用户在平台上移动的音

频的宝贵信息，并且可以用于通知以哪种语言提交转录和字幕作业。支持22 种语言。

2.主题提取

在对话或长篇文本中公开关键主题和引语。主题提取从非结构化文本内容中查找排名靠前的关键字、短语和主题。输出的详细程度可以通过简单的调整参数进行更改。

3.情绪分析

发现内容中的正面、中立和负面陈述。情绪分数范围从 -1 到 1 识别文本中的积极、消极和中性情绪。直接对纯文本或 Rev AI JSON 输出进行操作。使用 JSON，还提供

了支持语句的时间戳。

revai语音文本理解产品的核心优势是什么？

1.一流精度：

通过先进的语音识别技术和大量的数据训练，使得其语音识别引擎具备了强大的适应性和准确性，能够应对各种口音、语速及噪音环境下的语音识别任务。

当转录准确性很重要时，您可以依靠 Rev AI，

Rev AI 的 ASR 是最准确的

2.集成简单：

我们易于使用的 API 由开发人员为开发人员设计。

我们为您提供SDK、全面的文档和专家支持，以便您可以在几分钟内开始。所有你需要的生成第一个成绩单是访问令牌。

3.易于实施：设置并在一小时内查看结果。我们的 SDK 集合可让您立即启动并运行。

4.灵活部署：根据您的需求在云端或本地部署 Rev AI 的语音转文本引擎。

5.可靠性：我们保持 99.99% 的正常运行时间，并随时待命以响应安全警报和事件。

6.安全：我们会以应有的谨慎处理您的数据。所有文件都通过行业最佳实践进行静态加密和传输中加密。

revai语音文本理解产品有哪些使用限制？

流式语音转文本 API 存在以下限制：

流并发限制为 10。
每个流的时间限制为 3 小时。

当您的流接近 3 小时限制时，您应该初始化新的并发 WebSocket 连接。接受 WebSocket 连接并收到类型消息后，可以切换到新的 WebSocket 并开始将音频流式传输到其中。

在哪些场景会用到revai语音文本理解产品？

公司将 Rev AI 用于多种用例，包括商业智能、市场和用户研究、会议转录、以及手动任务的扩展。

媒体和娱乐

法律与合规

教育

呼叫中心和分析

大规模为视频添加字幕，提高内容

的可访问性和可搜索性，并提高

视频编辑效率。提高实时Web 或

广播内容的可访问性。

将 AI 语音识别用于数字证词、

电子取证、通话录音、风险分

析和法庭报告。

通过预先录制的课程提高讲座、

网络研讨会和活动的可访问性。

监控座席质量、培训座席、对呼叫

进行分类并进行呼叫后分析，以改善

客户体验，同时降低运营成本。

产品价格

适用范围：

个人&企业

免费方式：

有限试用

定价方式：

按量（例如每次/元、每token/美元）, 支持定制

价格：

价格详情：

透明灵活的定价，助您成长

适用于音频和视频应用程序的语音转文本 API

流持续时间和音频持续时间：

流持续时间是指自 WebSocket 连接建立以来经过的实际秒数。音频持续时间是指通过 WebSocket 连接发送的音频的秒数。对于大多数用例，这两者不会有显着差异，

作为用户，它们的差异可以忽略不计。但我们在这里单独引用它们，因为它们可能因您的实现而异。

在初始连接时，每个流会话都会尝试保留 10 分钟的积分。如果客户端没有 10 分钟的积分可以保留，则 WebSocket 将返回关闭消息。每当超过 5 分钟的实时时间（流

持续时间）过去时，Rev AI 就会尝试保留另外 5 分钟的积分。同样，如果客户端的配额用完，则 WebSocket 连接将关闭并显示关闭消息。建议启用自动重新加载，以防止

积分在中途用完。

关闭连接后，音频持续时间和流持续时间将最终确定。任何未使用的积分都将取消保留。任何暂时搁置的额外积分都将退还给客户，并可用于其他转录工作。您将为两者

中较大的一个付费，至少需要 15 秒。

使用指南

开始使用

这个简短的教程将教您向 Rev AI API 发出请求的基础知识。本教程使用异步语音转文本 API 生成你提交的音频文件的脚本。

假设

本教程假定您有一个 Rev AI 帐户。如果没有，请注册一个免费帐户。

第 1 步：获取访问令牌

第一步是生成访问令牌，该令牌将允许访问 Rev AI API。请按照下列步骤操作：

2.导航到“访问令牌”页面。

3.单击“生成新的访问令牌”链接。在弹出的对话框中确认操作。

Creating an access token

将生成新的访问令牌并显示在屏幕上。

警告

将您的访问令牌保存在安全的地方;您只能看到它们一次。一次最多允许 2 个访问令牌。

第 2 步：提交文件进行转录

使用以下命令将音频文件提交到 Rev AI 进行转录。将占位符替换为在步骤 1 中获取的访问令牌，并根据需要将下面显示的示例文件 URL 替换为您自己的音频文件的 URL。

curl -X POST "https://api.rev.ai/speechtotext/v1/jobs" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Content-Type: application/json" \
     -d '{"source_config": {"url": "https://www.rev.ai/FTC_Sample_1.mp3"},"metadata":"This is a test"}'

您将收到如下回复：

{
  "id": "Umx5c6F7pH7r",
  "created_on": "2021-09-15T05:14:38.13",
  "name": "FTC_Sample_1.mp3",
  "metadata": "This is a test",
  "status": "in_progress",
  "type": "async",
  "language": "en"
}

（在本例中）将使您能够检索您的成绩单。

第 3 步：检索成绩单

您现在需要等待作业完成。等待大约 1 分钟，然后通过查询 API 检查作业，如下所示：

curl -X GET https://api.rev.ai/speechtotext/v1/jobs/<ID> \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>"

警告

不建议在生产服务器中定期轮询 API 以获取作业状态。相反，在听录作业完成后，使用 Webhook 异步接收通知。

一旦听录作业更改为，您可以通过运行以下命令以 JSON 格式检索脚本。如前所述，将占位符替换为在步骤 1 中获取的访问令牌。还必须将占位符替换为在步骤 2 中获得的占位符。

curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: application/vnd.rev.transcript.v1.0+json"

下面是输出的示例：

{
  "monologues": [
    {
      "speaker": 1,
      "elements": [
        {
          "type": "text",
          "value": "Hi",
          "ts": 0.27,
          "end_ts": 0.32,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": ","
        },
        {
          "type": "punct",
          "value": " "
        },        
        {
          "type": "text",
          "value": "my",
          "ts": 0.35,
          "end_ts": 0.46,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": " "
        },
        {
          "type": "text",
          "value": "name's",
          "ts": 0.47,
          "end_ts": 0.59,
          "confidence": 1
        },
        {
          ...
        }
      ]
    },
    {
      ...
    }
  ]
}

或者，您可以通过运行以下命令来获取明文版本：

curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: text/plain"

后续步骤

您现在应该对如何使用 Rev AI API 有一个基本的想法。要了解更多信息，请阅读 API 文档，了解有关可用不同 API 及其功能的完整详细信息。您还可以找到代码示例和 SDK 文档，以帮助您将应用程序与 API 连接起来。

关于我们

revai

企业

Rev AI 是一家提供全球最准确语音转文字API的公司，支持58种以上语言的语音识别服务。公司提供异步、流媒体、人工转录等多种服务，并提供语言识别、情感分析、主题提取、摘要和翻译等洞察功能。Rev AI 以其低错误率、高准确性、多语言支持和高可读性转录而著称，同时提供世界级的安全标准和灵活的部署选项。

联系信息

服务时间： 00:00:00至24:00:00

电话号码： 1(888) 369-0701

邮箱： support@rev.ai

最可能同场景使用的其他API

实时语音翻译-有道专用API

【更新时间：2024.07.31】实时语音翻译服务是一款基于先进深度学习技术的翻译工具，能够即时将语音内容转换成多种语言。该服务支持多语言的语音识别与翻译，广泛应用于会议、在线学习和国际交流等场景，为用户提供流畅的跨语言沟通体验。

生活服务 > 语言翻译

130

刷脸支付-易生支付专用API

【更新时间：2024.07.31】刷脸支付是一种以AI人脸识别为核心的新型支付方式。人脸识别是百一种基于人的相貌特征信息进行身份认证的生物特征识别度技术，技术的最大特征是能避免个人信息泄露，并采用非接触的方式进行识别。

支付服务 > 聚合支付

四维图新导航专用API

【更新时间：2024.07.31】导航是一整套界面交互方案：借助导航画面和语音，给予用户指引和安全提醒，确保驾驶方向正确，提高驾驶安全性，优化使用体验。

位置服务 > 地图

视频内容安全专用API

【更新时间：2024.07.31】基于图像、文本、语音技术的综合审核能力，准确过滤视频中的色情、广告、恶心、违禁等违规内容，也能从美观、清晰等维度对视频进行筛选，紧贴业务需求，提升视频审核效率。

安全服务 > 业务安全

天翼云语音合成专用API

【更新时间：2024.07.31】语音合成（Text To Speech，TTS）将文本转成拟人化的语音。支持中文语音合成，提供男、女两种音色的选择，支持自定义语调、语速等参数。

AI技术 > AI语音 > 音频编辑

123

产品价格

适用范围：

个人&企业

免费方式：

有限试用

定价方式：

按量（例如每次/元、每token/美元）, 支持定制

价格：

价格详情：

透明灵活的定价，助您成长

适用于音频和视频应用程序的语音转文本 API

流持续时间和音频持续时间：

作为用户，它们的差异可以忽略不计。但我们在这里单独引用它们，因为它们可能因您的实现而异。

积分在中途用完。

中较大的一个付费，至少需要 15 秒。

使用指南

开始使用

这个简短的教程将教您向 Rev AI API 发出请求的基础知识。本教程使用异步语音转文本 API 生成你提交的音频文件的脚本。

假设

本教程假定您有一个 Rev AI 帐户。如果没有，请注册一个免费帐户。

第 1 步：获取访问令牌

第一步是生成访问令牌，该令牌将允许访问 Rev AI API。请按照下列步骤操作：

2.导航到“访问令牌”页面。

3.单击“生成新的访问令牌”链接。在弹出的对话框中确认操作。

Creating an access token

将生成新的访问令牌并显示在屏幕上。

警告

将您的访问令牌保存在安全的地方;您只能看到它们一次。一次最多允许 2 个访问令牌。

第 2 步：提交文件进行转录

curl -X POST "https://api.rev.ai/speechtotext/v1/jobs" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Content-Type: application/json" \
     -d '{"source_config": {"url": "https://www.rev.ai/FTC_Sample_1.mp3"},"metadata":"This is a test"}'

您将收到如下回复：

{
  "id": "Umx5c6F7pH7r",
  "created_on": "2021-09-15T05:14:38.13",
  "name": "FTC_Sample_1.mp3",
  "metadata": "This is a test",
  "status": "in_progress",
  "type": "async",
  "language": "en"
}

（在本例中）将使您能够检索您的成绩单。

第 3 步：检索成绩单

您现在需要等待作业完成。等待大约 1 分钟，然后通过查询 API 检查作业，如下所示：

curl -X GET https://api.rev.ai/speechtotext/v1/jobs/<ID> \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>"

警告

不建议在生产服务器中定期轮询 API 以获取作业状态。相反，在听录作业完成后，使用 Webhook 异步接收通知。

curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: application/vnd.rev.transcript.v1.0+json"

下面是输出的示例：

{
  "monologues": [
    {
      "speaker": 1,
      "elements": [
        {
          "type": "text",
          "value": "Hi",
          "ts": 0.27,
          "end_ts": 0.32,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": ","
        },
        {
          "type": "punct",
          "value": " "
        },        
        {
          "type": "text",
          "value": "my",
          "ts": 0.35,
          "end_ts": 0.46,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": " "
        },
        {
          "type": "text",
          "value": "name's",
          "ts": 0.47,
          "end_ts": 0.59,
          "confidence": 1
        },
        {
          ...
        }
      ]
    },
    {
      ...
    }
  ]
}

或者，您可以通过运行以下命令来获取明文版本：

curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: text/plain"

后续步骤

依赖服务

关于我们

revai

企业

联系信息

服务时间： 00:00:00至24:00:00

电话号码： 1(888) 369-0701

邮箱： support@rev.ai

最可能同场景使用的其他API

实时语音翻译-有道专用API

生活服务 > 语言翻译

130

支付服务 > 聚合支付

位置服务 > 地图

安全服务 > 业务安全

AI技术 > AI语音 > 音频编辑

123

revai语音文本理解产品

什么是revai语音文本理解产品?

revai语音文本理解产品有哪些核心功能？

revai语音文本理解产品的核心优势是什么？

revai语音文本理解产品有哪些使用限制？

在哪些场景会用到revai语音文本理解产品？

开始使用

假设

第 1 步：获取访问令牌

警告

第 2 步：提交文件进行转录

第 3 步：检索成绩单

警告

后续步骤

开始使用

假设

第 1 步：获取访问令牌

警告

第 2 步：提交文件进行转录

第 3 步：检索成绩单

警告

后续步骤

API平台

API平台

API学院

公司