语音转文本-Revai

语音转文本-Revai

专用API
服务商 服务商: revai
【更新时间: 2024.07.31】 Revai提供的语音转文字API是世界上最准确的 AI 和人类生成转录本的 API。Rev AI 从世界上最多样化的声音集合中训练而来,为视频和语音应用设定了准确性标准。
服务星级:2星
⭐ ⭐ 🌟 🌟 🌟 🌟 🌟
调用次数
0
集成人数
0
商用人数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是Revai的语音转文本?

 

RevAI语音文本理解产品是一种先进的技术解决方案,旨在通过深入分析音频内容来提取关键信息和洞察,从而为企业决策提供有力支持。这种产品结合了自然语言处理

(NLP)和机器学习算法,能够识别、转录并分析音频数据中的语音内容,进而生成准确的文本输出。

 

 

什么是Revai的语音转文本?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用Revai的语音转文本,从而实现程序的自动化交互,提高服务效率。

Revai的语音转文本有哪些核心功能?

 

1.语言识别

 
在转录音频或视频文件之前,自动检测音频或视频文件中使用的主要语言。语言识别会获取音频文件并返回最有可能使用的语言。 语言识别提供有关用户在平台上移动的音
频的宝贵信息,并且可以 用于通知以哪种语言提交转录和字幕作业。支持22 种语言。
 
 
 
 
2.主题提取
 
在对话或长篇文本中公开关键主题和引语。主题提取从非结构化文本内容中查找排名靠前的关键字、短语和主题。 输出的详细程度可以通过简单的调整参数进行更改。
 
 
 
 
3.情绪分析
 
发现内容中的正面、中立和负面陈述。情绪分数范围从 -1 到 1 识别文本中的积极、消极和中性情绪。 直接对纯文本或 Rev AI JSON 输出进行操作。使用 JSON,还提供
了支持语句的时间戳。
 
 
 
 

Revai的语音转文本的核心优势是什么?

 
 
1.一流精度:
 
通过先进的语音识别技术和大量的数据训练,使得其语音识别引擎具备了强大的适应性和准确性,能够应对各种口音、语速及噪音环境下的语音识别任务。

 

 

 


当转录准确性很重要时,您可以依靠 Rev AI,

Rev AI 的 ASR 是最准确的

 

2.集成简单:
 
我们易于使用的 API 由开发人员为开发人员设计。
我们为您提供SDK、全面的文档和专家 支持,以便您可以在几分钟内开始。所有你需要的生成第一个成绩单是访问令牌。
 
 
 
3.易于实施:设置并在一小时内查看结果。我们的 SDK 集合可让您立即启动并运行。

4.灵活部署:根据您的需求在云端或本地部署 Rev AI 的语音转文本引擎。

5.可靠性:我们保持 99.99% 的正常运行时间,并随时待命以响应安全警报和事件。

6.安全:我们会以应有的谨慎处理您的数据。所有文件都通过行业最佳实践进行静态加密和传输中加密。

Revai的语音转文本有哪些使用限制?

流式语音转文本 API 存在以下限制:

  • 流并发限制为 10。
  • 每个流的时间限制为 3 小时。

当您的流接近 3 小时限制时,您应该初始化新的并发 WebSocket 连接。接受 WebSocket 连接并收到类型消息后,可以切换到新的 WebSocket 并开始将音频流式传输到其中。

 

在哪些场景会用到Revai的语音转文本?

 

 

公司将 Rev AI 用于多种用例, 包括商业智能、市场和用户研究、会议转录、 以及手动任务的扩展。

 

媒体和娱乐

法律与合规

教育

呼叫中心和分析



大规模为视频添加字幕,提高内容

的可访问性和可搜索性,并提高

视频编辑效率。提高实时Web 或

广播内容的可访问性。


将 AI 语音识别用于数字证词、

电子取证、通话录音、风险分

析和法庭报告。

通过预先录制的课程提高讲座、

网络研讨会和活动的可访问性。


监控座席质量、培训座席、对呼叫

进行分类并进行呼叫后分析,以改善

客户体验,同时降低运营成本。

<
产品价格
>

透明灵活的定价,助您成长


适用于音频和视频应用程序的语音转文本 API

 

 

流持续时间和音频持续时间:

    流持续时间是指自 WebSocket 连接建立以来经过的实际秒数。音频持续时间是指通过 WebSocket 连接发送的音频的秒数。 对于大多数用例,这两者不会有显着差异,

作为用户,它们的差异可以忽略不计。但我们在这里单独引用它们,因为它们可能因您的实现而异。

    在初始连接时,每个流会话都会尝试保留 10 分钟的积分。如果客户端没有 10 分钟的积分可以保留,则 WebSocket 将返回关闭消息。每当超过 5 分钟的实时时间(流

持续时间)过去时,Rev AI 就会尝试保留另外 5 分钟的积分。同样,如果客户端的配额用完,则 WebSocket 连接将关闭并显示关闭消息。建议启用自动重新加载,以防止

积分在中途用完。

     关闭连接后,音频持续时间和流持续时间将最终确定。任何未使用的积分都将取消保留。任何暂时搁置的额外积分都将退还给客户,并可用于其他转录工作。您将为两者

中较大的一个付费,至少需要 15 秒。

 

<
使用指南
>

开始使用

这个简短的教程将教您向 Rev AI API 发出请求的基础知识。本教程使用异步语音转文本 API 生成你提交的音频文件的脚本。

 

假设

本教程假定您有一个 Rev AI 帐户。如果没有,请注册一个免费帐户

 

 

 

第 1 步:获取访问令牌

第一步是生成访问令牌,该令牌将允许访问 Rev AI API。请按照下列步骤操作:

  1. 登录 Rev AI。

    2.导航到“访问令牌”页面

    3.单击“生成新的访问令牌”链接。在弹出的对话框中确认操作。

 

Creating an access token

将生成新的访问令牌并显示在屏幕上。

警告

将您的访问令牌保存在安全的地方;您只能看到它们一次。一次最多允许 2 个访问令牌。

 

 

 

第 2 步:提交文件进行转录

 

使用以下命令将音频文件提交到 Rev AI 进行转录。将占位符替换为在步骤 1 中获取的访问令牌,并根据需要将下面显示的示例文件 URL 替换为您自己的音频文件的 URL。

 
curl -X POST "https://api.rev.ai/speechtotext/v1/jobs" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Content-Type: application/json" \
     -d '{"source_config": {"url": "https://www.rev.ai/FTC_Sample_1.mp3"},"metadata":"This is a test"}'

您将收到如下回复:

 
{
  "id": "Umx5c6F7pH7r",
  "created_on": "2021-09-15T05:14:38.13",
  "name": "FTC_Sample_1.mp3",
  "metadata": "This is a test",
  "status": "in_progress",
  "type": "async",
  "language": "en"
}

(在本例中)将使您能够检索您的成绩单。

 
 
 
 

第 3 步:检索成绩单

 

您现在需要等待作业完成。等待大约 1 分钟,然后通过查询 API 检查作业,如下所示:

 
curl -X GET https://api.rev.ai/speechtotext/v1/jobs/<ID> \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>"
警告

不建议在生产服务器中定期轮询 API 以获取作业状态。相反,在听录作业完成后,使用 Webhook 异步接收通知。

一旦听录作业更改为 ,您可以通过运行以下命令以 JSON 格式检索脚本。如前所述,将占位符替换为在步骤 1 中获取的访问令牌。还必须将占位符替换为在步骤 2 中获得的占位符。

 
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: application/vnd.rev.transcript.v1.0+json"

 

下面是输出的示例:

 
{
  "monologues": [
    {
      "speaker": 1,
      "elements": [
        {
          "type": "text",
          "value": "Hi",
          "ts": 0.27,
          "end_ts": 0.32,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": ","
        },
        {
          "type": "punct",
          "value": " "
        },        
        {
          "type": "text",
          "value": "my",
          "ts": 0.35,
          "end_ts": 0.46,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": " "
        },
        {
          "type": "text",
          "value": "name's",
          "ts": 0.47,
          "end_ts": 0.59,
          "confidence": 1
        },
        {
          ...
        }
      ]
    },
    {
      ...
    }
  ]
}

或者,您可以通过运行以下命令来获取明文版本:

 
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: text/plain"

 

 

后续步骤

您现在应该对如何使用 Rev AI API 有一个基本的想法。要了解更多信息,请阅读 API 文档,了解有关可用不同 API 及其功能的完整详细信息。您还可以找到代码示例和 SDK 文档,以帮助您将应用程序与 API 连接起来。

<
关于我们
>
revai
企业
Rev AI是一家专注于语音识别技术的公司,提供业界最准确的API服务,用于AI和人工生成的语音转文字。公司训练的语音模型基于超过300万小时的人工转录音频内容,确保了高准确率。Rev AI支持58种以上语言,并提供实时和非实时的语音转文字服务。此外,公司还提供语言识别、情感分析、主题提取、自动摘要和翻译等洞察服务,帮助用户超越语言障碍,提高工作效率。Rev AI注重数据安全,符合SOC II、HIPAA、GDPR和PCI等安全标准。
联系信息
服务时间: 00:00:00至24:00:00
邮箱: support@rev.ai
<
最可能同场景使用的其他API
>
API接口列表
<
产品价格
>

透明灵活的定价,助您成长


适用于音频和视频应用程序的语音转文本 API

 

 

流持续时间和音频持续时间:

    流持续时间是指自 WebSocket 连接建立以来经过的实际秒数。音频持续时间是指通过 WebSocket 连接发送的音频的秒数。 对于大多数用例,这两者不会有显着差异,

作为用户,它们的差异可以忽略不计。但我们在这里单独引用它们,因为它们可能因您的实现而异。

    在初始连接时,每个流会话都会尝试保留 10 分钟的积分。如果客户端没有 10 分钟的积分可以保留,则 WebSocket 将返回关闭消息。每当超过 5 分钟的实时时间(流

持续时间)过去时,Rev AI 就会尝试保留另外 5 分钟的积分。同样,如果客户端的配额用完,则 WebSocket 连接将关闭并显示关闭消息。建议启用自动重新加载,以防止

积分在中途用完。

     关闭连接后,音频持续时间和流持续时间将最终确定。任何未使用的积分都将取消保留。任何暂时搁置的额外积分都将退还给客户,并可用于其他转录工作。您将为两者

中较大的一个付费,至少需要 15 秒。

 

<
使用指南
>

开始使用

这个简短的教程将教您向 Rev AI API 发出请求的基础知识。本教程使用异步语音转文本 API 生成你提交的音频文件的脚本。

 

假设

本教程假定您有一个 Rev AI 帐户。如果没有,请注册一个免费帐户

 

 

 

第 1 步:获取访问令牌

第一步是生成访问令牌,该令牌将允许访问 Rev AI API。请按照下列步骤操作:

  1. 登录 Rev AI。

    2.导航到“访问令牌”页面

    3.单击“生成新的访问令牌”链接。在弹出的对话框中确认操作。

 

Creating an access token

将生成新的访问令牌并显示在屏幕上。

警告

将您的访问令牌保存在安全的地方;您只能看到它们一次。一次最多允许 2 个访问令牌。

 

 

 

第 2 步:提交文件进行转录

 

使用以下命令将音频文件提交到 Rev AI 进行转录。将占位符替换为在步骤 1 中获取的访问令牌,并根据需要将下面显示的示例文件 URL 替换为您自己的音频文件的 URL。

 
curl -X POST "https://api.rev.ai/speechtotext/v1/jobs" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Content-Type: application/json" \
     -d '{"source_config": {"url": "https://www.rev.ai/FTC_Sample_1.mp3"},"metadata":"This is a test"}'

您将收到如下回复:

 
{
  "id": "Umx5c6F7pH7r",
  "created_on": "2021-09-15T05:14:38.13",
  "name": "FTC_Sample_1.mp3",
  "metadata": "This is a test",
  "status": "in_progress",
  "type": "async",
  "language": "en"
}

(在本例中)将使您能够检索您的成绩单。

 
 
 
 

第 3 步:检索成绩单

 

您现在需要等待作业完成。等待大约 1 分钟,然后通过查询 API 检查作业,如下所示:

 
curl -X GET https://api.rev.ai/speechtotext/v1/jobs/<ID> \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>"
警告

不建议在生产服务器中定期轮询 API 以获取作业状态。相反,在听录作业完成后,使用 Webhook 异步接收通知。

一旦听录作业更改为 ,您可以通过运行以下命令以 JSON 格式检索脚本。如前所述,将占位符替换为在步骤 1 中获取的访问令牌。还必须将占位符替换为在步骤 2 中获得的占位符。

 
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: application/vnd.rev.transcript.v1.0+json"

 

下面是输出的示例:

 
{
  "monologues": [
    {
      "speaker": 1,
      "elements": [
        {
          "type": "text",
          "value": "Hi",
          "ts": 0.27,
          "end_ts": 0.32,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": ","
        },
        {
          "type": "punct",
          "value": " "
        },        
        {
          "type": "text",
          "value": "my",
          "ts": 0.35,
          "end_ts": 0.46,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": " "
        },
        {
          "type": "text",
          "value": "name's",
          "ts": 0.47,
          "end_ts": 0.59,
          "confidence": 1
        },
        {
          ...
        }
      ]
    },
    {
      ...
    }
  ]
}

或者,您可以通过运行以下命令来获取明文版本:

 
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: text/plain"

 

 

后续步骤

您现在应该对如何使用 Rev AI API 有一个基本的想法。要了解更多信息,请阅读 API 文档,了解有关可用不同 API 及其功能的完整详细信息。您还可以找到代码示例和 SDK 文档,以帮助您将应用程序与 API 连接起来。

<
依赖服务
>
<
关于我们
>
revai
企业
Rev AI是一家专注于语音识别技术的公司,提供业界最准确的API服务,用于AI和人工生成的语音转文字。公司训练的语音模型基于超过300万小时的人工转录音频内容,确保了高准确率。Rev AI支持58种以上语言,并提供实时和非实时的语音转文字服务。此外,公司还提供语言识别、情感分析、主题提取、自动摘要和翻译等洞察服务,帮助用户超越语言障碍,提高工作效率。Rev AI注重数据安全,符合SOC II、HIPAA、GDPR和PCI等安全标准。
联系信息
服务时间: 00:00:00至24:00:00
邮箱: support@rev.ai
<
最可能同场景使用的其他API
>