AssemblyAI是一家领先的人工智能公司，专注于开发先进的语音人工智能模型。公司提供包括准确语音转文字、说话人识别、情感分析、章节检测、个人信息编辑等功能的API服务。其最新推出的Universal-1模型，经过12.5百万小时多语言音频数据训练，代表了公司在语音识别技术上的最新突破。AssemblyAI致力于帮助客户通过语音数据构建创新的AI产品，并通过持续的模型更新，确保客户始终能够使用到最前沿的AI技术。

收录时间：2024.06.04

详情信息 >

日本 wit

评分 52

智能识别语音识别

Wit.ai 是一个提供自然语言处理和语音识别服务的平台，主要业务包括快速构建和训练聊天机器人、语音助手等智能应用。用户可以通过Wit.ai提供的API和工具，实现语音识别、意图识别和实体抽取等功能，广泛应用于客户服务、智能家居等领域。

收录时间：2024.11.08

详情信息 >

美国 speechace

评分 51

智能识别语音识别

Speechace 是一家专注于通过语音识别技术评估发音和流利度的公司。他们开发了一流的语音识别技术，专门为评估发音和流利度而设计。Speechace 的愿景是使练习和提高口语能力变得容易，而无需密集的一对一指导。他们的技术能够立即提供针对性的反馈，帮助学习者识别错误并进行改进。此外，他们还提供 API 服务，供教育领域的出版商、语言学习提供商、大学和 K-12 教育机构使用。

收录时间：2024.07.19

详情信息 >

中国云知声AI开放平台

评分 51

智能识别语音识别

云知声AI开放平台是一家专注于人工智能语音交互技术的公司，提供包括语音识别、语音合成和语音分析在内的全方位AI语音技术解决方案。主营业务涵盖一句话识别、实时语音转写、音频文件转写、短文本语音合成、长文本语音合成、音库定制、口语评测和声纹识别等服务。公司致力于通过易用、实惠、稳定的服务，帮助客户实现产品的智能升级。

收录时间：2024.07.08

详情信息 >

美国 Speechmatics

评分 51

智能识别语音识别

Speechmatics 是一家专注于人工智能语音技术的公司，提供实时语音转文本API服务。公司的产品支持50多种语言的实时转录和翻译，适用于多种场景，如媒体监控、会议平台、教育技术等。其技术在实时转录、翻译和语音智能方面具有高准确性和低延迟的特点，致力于帮助企业构建高质量的语音应用。

收录时间：2024.07.19

详情信息 >

中国香港 IBM

评分 50

智能识别语音识别

IBM Watson Speech to Text 是一种先进的语音转文本技术，支持多种语言的快速准确语音转录。它适用于客户自助服务、代理协助和语音分析等多种场景。IBM 提供了预训练的机器学习模型，并允许用户根据特定需求进行定制。此外，IBM Watson Speech to Text 还提供容器化库，供合作伙伴嵌入到商业应用中。

收录时间：2024.06.06

详情信息 >

美国 revai

评分 50

智能识别语音识别

Rev AI 是一家提供全球最准确语音转文字API的公司，支持58种以上语言的语音识别服务。公司提供异步、流媒体、人工转录等多种服务，并提供语言识别、情感分析、主题提取、摘要和翻译等洞察功能。Rev AI 以其低错误率、高准确性、多语言支持和高可读性转录而著称，同时提供世界级的安全标准和灵活的部署选项。

收录时间：2024.05.21

详情信息 >

英国 intelligentvoice

评分 47

智能识别语音识别

Intelligent Voice是一家提供智能语音和自然语言处理（NLP）解决方案的公司，专注于为企业提供安全、高效的语音识别、转录和分析服务。公司通过先进的API和生成式人工智能技术，能够将音频或视频记录准确转录并分析，以增强业务操作、快速收集情报和扩展分析。Intelligent Voice的技术广泛应用于金融、保险、政府、紧急服务和法律等多个行业，支持30多种语言和方言，确保数据安全，并提供易于部署的40多个连接器，以无缝集成到现有技术堆栈中。

收录时间：2024.07.24

详情信息 >

安道尔 Scriptix

评分 47

智能识别语音识别

Scriptix提供基于云的语音转文本服务，支持实时或批量处理。公司专注于定制化语音识别模型，以满足不同客户的需求。服务支持13种语言，并可根据需求定制特定语言模型。Scriptix的语音识别技术广泛应用于媒体、政府、医疗、电信和新闻等行业，适用于个人用户、团队和企业客户。

收录时间：2024.06.11

详情信息 >

法国 SpeechText.AI

评分 45

智能识别语音识别

SpeechText.AI是一家专注于语音转文本的人工智能软件公司，提供音频和视频文件的高精度转录服务。公司采用先进的深度神经网络模型，支持30多种语言和非母语口音，提供多领域优化模型以提高识别准确率。主营业务包括语音识别、多语言支持、说话人识别、领域特定模型、音频搜索引擎、自动标点和编辑工具等，旨在帮助用户快速、准确地将语音内容转换为文本。

收录时间：2024.11.07

详情信息 >

美国 lemonfox

评分 39

智能识别语音识别

Lemonfox.ai提供低成本、易于使用的转录和人工智能API，支持100多种语言的音频转文字服务，价格低于每小时0.17美元。具备说话人识别功能，使用最新的Whisper large-v3 AI模型，确保高准确度和低延迟。

收录时间：2024.11.07

详情信息 >

美国 Voice Transcribe

评分 35

智能识别语音识别

Voice Transcribe是一家提供英语语音转文本转录服务的公司。我们以99.8%的准确率和最低的价格提供服务，支持98+种语言，并提供无限小时的转录服务。我们的平台支持多种音频文件格式，提供快速准确的转录结果，并保证数据的私密性和安全性。