revai语音文本理解产品
专用API
服务商:
revai
【更新时间: 2024.07.31】
世界上最准确的 AI 和人类生成转录本的 API。Rev AI 从世界上最多样化的声音集合中训练而来,为视频和语音应用设定了准确性标准。
咨询
去服务商官网采购>
|
服务星级:2星
浏览次数
12
采购人数
2
试用次数
0
SLA: N/A
响应: N/A
适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
|
- API详情
- 定价
- 使用指南
- 关于我们
- 相关推荐
什么是revai语音文本理解产品?
RevAI语音文本理解产品是一种先进的技术解决方案,旨在通过深入分析音频内容来提取关键信息和洞察,从而为企业决策提供有力支持。这种产品结合了自然语言处理
(NLP)和机器学习算法,能够识别、转录并分析音频数据中的语音内容,进而生成准确的文本输出。
什么是revai语音文本理解产品接口?
revai语音文本理解产品有哪些核心功能?
1.语言识别
revai语音文本理解产品的核心优势是什么?
Rev AI 的 ASR 是最准确的 |
2.集成简单:
4.灵活部署:根据您的需求在云端或本地部署 Rev AI 的语音转文本引擎。
5.可靠性:我们保持 99.99% 的正常运行时间,并随时待命以响应安全警报和事件。
6.安全:我们会以应有的谨慎处理您的数据。所有文件都通过行业最佳实践进行静态加密和传输中加密。
revai语音文本理解产品有哪些使用限制?
流式语音转文本 API 存在以下限制:
- 流并发限制为 10。
- 每个流的时间限制为 3 小时。
当您的流接近 3 小时限制时,您应该初始化新的并发 WebSocket 连接。接受 WebSocket 连接并收到类型消息后,可以切换到新的 WebSocket 并开始将音频流式传输到其中。
在哪些场景会用到revai语音文本理解产品?
公司将 Rev AI 用于多种用例, 包括商业智能、市场和用户研究、会议转录、 以及手动任务的扩展。
媒体和娱乐 |
法律与合规 |
教育 |
呼叫中心和分析 |
的可访问性和可搜索性,并提高 视频编辑效率。提高实时Web 或 广播内容的可访问性。 |
电子取证、通话录音、风险分 析和法庭报告。 |
通过预先录制的课程提高讲座、 网络研讨会和活动的可访问性。 |
进行分类并进行呼叫后分析,以改善 客户体验,同时降低运营成本。 |
透明灵活的定价,助您成长
适用于音频和视频应用程序的语音转文本 API
流持续时间和音频持续时间:
流持续时间是指自 WebSocket 连接建立以来经过的实际秒数。音频持续时间是指通过 WebSocket 连接发送的音频的秒数。 对于大多数用例,这两者不会有显着差异,
作为用户,它们的差异可以忽略不计。但我们在这里单独引用它们,因为它们可能因您的实现而异。
在初始连接时,每个流会话都会尝试保留 10 分钟的积分。如果客户端没有 10 分钟的积分可以保留,则 WebSocket 将返回关闭消息。每当超过 5 分钟的实时时间(流
持续时间)过去时,Rev AI 就会尝试保留另外 5 分钟的积分。同样,如果客户端的配额用完,则 WebSocket 连接将关闭并显示关闭消息。建议启用自动重新加载,以防止
积分在中途用完。
关闭连接后,音频持续时间和流持续时间将最终确定。任何未使用的积分都将取消保留。任何暂时搁置的额外积分都将退还给客户,并可用于其他转录工作。您将为两者
中较大的一个付费,至少需要 15 秒。
开始使用
这个简短的教程将教您向 Rev AI API 发出请求的基础知识。本教程使用异步语音转文本 API 生成你提交的音频文件的脚本。
假设
本教程假定您有一个 Rev AI 帐户。如果没有,请注册一个免费帐户。
第 1 步:获取访问令牌
第一步是生成访问令牌,该令牌将允许访问 Rev AI API。请按照下列步骤操作:
- 登录 Rev AI。
2.导航到“访问令牌”页面。
3.单击“生成新的访问令牌”链接。在弹出的对话框中确认操作。
将生成新的访问令牌并显示在屏幕上。
警告
将您的访问令牌保存在安全的地方;您只能看到它们一次。一次最多允许 2 个访问令牌。
第 2 步:提交文件进行转录
使用以下命令将音频文件提交到 Rev AI 进行转录。将占位符替换为在步骤 1 中获取的访问令牌,并根据需要将下面显示的示例文件 URL 替换为您自己的音频文件的 URL。
curl -X POST "https://api.rev.ai/speechtotext/v1/jobs" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Content-Type: application/json" \
-d '{"source_config": {"url": "https://www.rev.ai/FTC_Sample_1.mp3"},"metadata":"This is a test"}'
您将收到如下回复:
{
"id": "Umx5c6F7pH7r",
"created_on": "2021-09-15T05:14:38.13",
"name": "FTC_Sample_1.mp3",
"metadata": "This is a test",
"status": "in_progress",
"type": "async",
"language": "en"
}
(在本例中)将使您能够检索您的成绩单。
第 3 步:检索成绩单
您现在需要等待作业完成。等待大约 1 分钟,然后通过查询 API 检查作业,如下所示:
curl -X GET https://api.rev.ai/speechtotext/v1/jobs/<ID> \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>"
警告
不建议在生产服务器中定期轮询 API 以获取作业状态。相反,在听录作业完成后,使用 Webhook 异步接收通知。
一旦听录作业更改为 ,您可以通过运行以下命令以 JSON 格式检索脚本。如前所述,将占位符替换为在步骤 1 中获取的访问令牌。还必须将占位符替换为在步骤 2 中获得的占位符。
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Accept: application/vnd.rev.transcript.v1.0+json"
下面是输出的示例:
{
"monologues": [
{
"speaker": 1,
"elements": [
{
"type": "text",
"value": "Hi",
"ts": 0.27,
"end_ts": 0.32,
"confidence": 1
},
{
"type": "punct",
"value": ","
},
{
"type": "punct",
"value": " "
},
{
"type": "text",
"value": "my",
"ts": 0.35,
"end_ts": 0.46,
"confidence": 1
},
{
"type": "punct",
"value": " "
},
{
"type": "text",
"value": "name's",
"ts": 0.47,
"end_ts": 0.59,
"confidence": 1
},
{
...
}
]
},
{
...
}
]
}
或者,您可以通过运行以下命令来获取明文版本:
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Accept: text/plain"
后续步骤
您现在应该对如何使用 Rev AI API 有一个基本的想法。要了解更多信息,请阅读 API 文档,了解有关可用不同 API 及其功能的完整详细信息。您还可以找到代码示例和 SDK 文档,以帮助您将应用程序与 API 连接起来。
透明灵活的定价,助您成长
适用于音频和视频应用程序的语音转文本 API
流持续时间和音频持续时间:
流持续时间是指自 WebSocket 连接建立以来经过的实际秒数。音频持续时间是指通过 WebSocket 连接发送的音频的秒数。 对于大多数用例,这两者不会有显着差异,
作为用户,它们的差异可以忽略不计。但我们在这里单独引用它们,因为它们可能因您的实现而异。
在初始连接时,每个流会话都会尝试保留 10 分钟的积分。如果客户端没有 10 分钟的积分可以保留,则 WebSocket 将返回关闭消息。每当超过 5 分钟的实时时间(流
持续时间)过去时,Rev AI 就会尝试保留另外 5 分钟的积分。同样,如果客户端的配额用完,则 WebSocket 连接将关闭并显示关闭消息。建议启用自动重新加载,以防止
积分在中途用完。
关闭连接后,音频持续时间和流持续时间将最终确定。任何未使用的积分都将取消保留。任何暂时搁置的额外积分都将退还给客户,并可用于其他转录工作。您将为两者
中较大的一个付费,至少需要 15 秒。
开始使用
这个简短的教程将教您向 Rev AI API 发出请求的基础知识。本教程使用异步语音转文本 API 生成你提交的音频文件的脚本。
假设
本教程假定您有一个 Rev AI 帐户。如果没有,请注册一个免费帐户。
第 1 步:获取访问令牌
第一步是生成访问令牌,该令牌将允许访问 Rev AI API。请按照下列步骤操作:
- 登录 Rev AI。
2.导航到“访问令牌”页面。
3.单击“生成新的访问令牌”链接。在弹出的对话框中确认操作。
将生成新的访问令牌并显示在屏幕上。
警告
将您的访问令牌保存在安全的地方;您只能看到它们一次。一次最多允许 2 个访问令牌。
第 2 步:提交文件进行转录
使用以下命令将音频文件提交到 Rev AI 进行转录。将占位符替换为在步骤 1 中获取的访问令牌,并根据需要将下面显示的示例文件 URL 替换为您自己的音频文件的 URL。
curl -X POST "https://api.rev.ai/speechtotext/v1/jobs" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Content-Type: application/json" \
-d '{"source_config": {"url": "https://www.rev.ai/FTC_Sample_1.mp3"},"metadata":"This is a test"}'
您将收到如下回复:
{
"id": "Umx5c6F7pH7r",
"created_on": "2021-09-15T05:14:38.13",
"name": "FTC_Sample_1.mp3",
"metadata": "This is a test",
"status": "in_progress",
"type": "async",
"language": "en"
}
(在本例中)将使您能够检索您的成绩单。
第 3 步:检索成绩单
您现在需要等待作业完成。等待大约 1 分钟,然后通过查询 API 检查作业,如下所示:
curl -X GET https://api.rev.ai/speechtotext/v1/jobs/<ID> \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>"
警告
不建议在生产服务器中定期轮询 API 以获取作业状态。相反,在听录作业完成后,使用 Webhook 异步接收通知。
一旦听录作业更改为 ,您可以通过运行以下命令以 JSON 格式检索脚本。如前所述,将占位符替换为在步骤 1 中获取的访问令牌。还必须将占位符替换为在步骤 2 中获得的占位符。
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Accept: application/vnd.rev.transcript.v1.0+json"
下面是输出的示例:
{
"monologues": [
{
"speaker": 1,
"elements": [
{
"type": "text",
"value": "Hi",
"ts": 0.27,
"end_ts": 0.32,
"confidence": 1
},
{
"type": "punct",
"value": ","
},
{
"type": "punct",
"value": " "
},
{
"type": "text",
"value": "my",
"ts": 0.35,
"end_ts": 0.46,
"confidence": 1
},
{
"type": "punct",
"value": " "
},
{
"type": "text",
"value": "name's",
"ts": 0.47,
"end_ts": 0.59,
"confidence": 1
},
{
...
}
]
},
{
...
}
]
}
或者,您可以通过运行以下命令来获取明文版本:
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Accept: text/plain"
后续步骤
您现在应该对如何使用 Rev AI API 有一个基本的想法。要了解更多信息,请阅读 API 文档,了解有关可用不同 API 及其功能的完整详细信息。您还可以找到代码示例和 SDK 文档,以帮助您将应用程序与 API 连接起来。