14个文本转图像AI API
如何获取revai API开放平台密钥(分步指南)
在数字媒体创作、软件开发项目乃至我们的日常生活中,获取并处理实时、准确的信息已成为不可或缺的一部分,其中,自然语言处理(NLP)及AI相关服务的需求日益增长。Revai API开放平台凭借其强大的功能,为开发者提供了丰富的工具,使得集成先进的语音识别、文本分析等功能变得前所未有的简单。本文将作为一份详尽的分步指南,教你如何获取Revai API开放平台的密钥,从而开启将智能服务融入你应用或项目的旅程。此外,我们还会简要介绍如何对获取的密钥进行初步验证,以及在使用过程中可能需要关注的几个关键方面。
1. 登录/注册revai API开放平台
2. 获取访问令牌
- 登录到版本AI。
- 导航至“访问令牌”页。
- 单击生成新访问令牌链接。在弹出的对话框中确认操作。
3. 请求示例
1.提交文件进行转录
使用下面的命令提交一个音频文件给Rev AI进行转录。用第1步中获得的访问令牌替换<REVAI_ACCESS_TOKEN>
占位符,如果需要,用您自己的音频文件的URL替换下面显示的示例文件URL。
curl -X POST "https://api.rev.ai/speechtotext/v1/jobs" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Content-Type: application/json" \
-d '{"source_config": {"url": "https://www.rev.ai/FTC_Sample_1.mp3"},"metadata":"This is a test"}'
你会收到这样的回复:
{
"id": "Umx5c6F7pH7r",
"created_on": "2021-09-15T05:14:38.13",
"name": "FTC_Sample_1.mp3",
"metadata": "This is a test",
"status": "in_progress",
"type": "async",
"language": "en"
}
id
(在这种情况下Umx5c6F7pH7r
)将使您能够检索您的成绩单。
2.修改成绩单
您现在需要等待作业完成。等待大约1分钟,然后通过查询API检查作业的status
,如下所示:
curl -X GET https://api.rev.ai/speechtotext/v1/jobs/<ID> \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>"
一旦转录作业的status
更改为transcribed
,您可以通过运行以下命令以JSON格式检索转录。和前面一样,用步骤1中获得的访问令牌替换<REVAI_ACCESS_TOKEN>
占位符。您还必须将<ID>
占位符替换为步骤2中获得的id
占位符。
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Accept: application/vnd.rev.transcript.v1.0+json"
下面是输出的一个例子:
{
"monologues": [
{
"speaker": 1,
"elements": [
{
"type": "text",
"value": "Hi",
"ts": 0.27,
"end_ts": 0.32,
"confidence": 1
},
{
"type": "punct",
"value": ","
},
{
"type": "punct",
"value": " "
},
{
"type": "text",
"value": "my",
"ts": 0.35,
"end_ts": 0.46,
"confidence": 1
},
{
"type": "punct",
"value": " "
},
{
"type": "text",
"value": "name's",
"ts": 0.47,
"end_ts": 0.59,
"confidence": 1
},
{
...
}
]
},
{
...
}
]
}
或者,您可以通过运行以下命令来获取纯文本版本:
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Accept: text/plain"
4. 常见问题
Q:如何找到revai API开放平台
A:幂简集成是国内领先的API集成管理平台,专注于为开发者提供全面、高效、易用的API集成解决方案。幂简API平台可以通过以下两种方式找到所需API:通过关键词搜索API(例如,输入’revai API开放平台‘这类品类词,更容易找到结果)、或者从API hub分类页进入寻找。
Q:Rev AI支持哪些语言?
A:Rev AI在异步语音转文本API中支持58种以上语言,在流语音转文本API中支持9种以上语言。新的语言经常被添加。请参阅当前支持的语言列表。
Q:在文字记录中,长时间的停顿是如何表现的?
A:这取决于确切的停顿长度,但通常情况下,长时间的停顿会导致文字稿在讲话恢复时开始一个新的段落。停顿由其周围单词上的时间戳指示。在停顿周围的单词上会有一个时间戳的跳跃。
以下默认限制适用于异步语音转文本API的每个用户和每个端点:
- 每10分钟就有10,000份转录请求提交。
- 每10分钟处理500个放射性物质。任何提交超过此将被接受,但放入队列,直到下一个间隔才开始。
- 最大音频持续时间为17小时。
- 作为
multipart/form-data
请求提交到/jobs
端点的文件上传的并发限制为5,每个请求的文件大小限制为2 GB。 - 通过Rev AI仪表板或使用
source_config
job参数上传的文件大小限制为5 TB。
这些限值可通过版本AI支持进行调整。
Q:Rev AI支持什么类型的媒体文件?
A:Rev AI使用FFmpeg,因此支持FFmpeg支持的所有文件格式。这包括所有常见的媒体格式,如MP3,MP4,Ogg,WAV,PCM和FLAC等等。
Q:允许的最大文件大小和音频持续时间是多少?
A:
允许的最大文件大小取决于提交方法。如果将本地文件从主机作为multipart/form-data
请求,每个请求的文件大小限制为2 GB。如果通过Rev AI仪表板上传本地文件或通过source_config
作业参数,则文件大小限制为5 TB。
允许的最大音频长度为17小时。对于超过17小时的音频,有必要将音频文件拆分为小于17小时的块并单独转录。
除了revai API开放平台,还有其他替代服务商也提供类似api服务,例如:
PingMe API开放平台、twinpush API开放平台、AssemblyAI API开放平台
更多竞品可以在幂简集成开放平台中找到。
Q:revai API开放平台这个密钥还适用于哪些api?
异步语音转文本API、流式语音转文本API、自定义词汇API
5. 总结
本文全面且细致地介绍了如何获取Revai API开放平台密钥的分步指南,为开发者们提供了一份条理清晰、操作简便的实用手册。从Revai API平台的账号注册开始,到完成开发者身份认证,再到最终成功获取密钥,每一步操作都配以详尽的说明与指导,确保开发者能够轻松、准确地完成整个流程。获取密钥只是利用Revai API的第一步,如何高效、稳定地集成并应用其强大的语音识别、文本分析等功能才是关键。因此,在本文中,我们不仅指导了如何获取密钥,还隐含地强调了获取后进行初步测试与验证的重要性。通过测试,开发者可以确保Revai API能够顺利集成到应用中,并发挥出最佳效果,从而助力提升应用的性能和用户体验。本文为开发者们提供了一个全面、详尽且极具实用性的操作指南,帮助他们顺利获取Revai API开放平台的密钥,并将这一强大的AI服务能力高效地集成到应用中。我们相信,随着开发者们对这一指南的深入理解和实践,将能够在语音识别、文本分析等领域取得更加显著的成果,为应用的智能化发展注入新的动力。