人声提取服务-团子AI

专用API

服务商：长春肉片丝瓜科技有限公司

【更新时间: 2024.08.12】一种基于先进的人工智能技术，专注于从各种音频中分离出清晰、高质量的人声的服务。特别是其独家自研的DangoNet 4神经网络和10.0系列搭配的全新第四代基准算法，实现了对音频中人声的精准提取。

0元起去服务商官网采购>

浏览次数

141

采购人数

试用次数

SLA: N/A

响应: N/A

适用于个人&企业

试用

书签名称

确定

相似API

音频内容安全-腾讯

音频内容安全（Audio Moderation System，AMS）能自动识别音频内容，识别并审核音频中出现的可能令人反感、不安全或不适宜内容，并支持自定义黑名单热词，识别自定义类型的音频内容。

营养成分表查询

479

营养成分表查询，可查询近两千种常见食物极为详细的营养成分以及 100 克下的微量元素含量。它支持食品种类的检索，能方便地找到目标食物，还可对食物成分含量进行排序，以便更好地了解和分析各种食物的营养情况。

音源分离-火山引擎

201

火山引擎音源分离，即 MusicSourceSeparate，致力于为用户赋予强大的歌曲音源分离能力。它能精准地将歌曲中的不同音源有效分离开来，从而为用户在音乐处理等相关领域提供专业且高效的支持与服务。

API详情
定价
使用指南
关于我们
相关推荐

产品介绍

什么是团子AI的人声提取服务?

"人声提取服务【团子AI】"是一种基于先进的人工智能技术，专注于从各种音频中分离出清晰、高质量的人声的服务。该服务利用团子AI实验室自研的顶级算法，特别是其独家自研的DangoNet 4神经网络和10.0系列搭配的全新第四代基准算法，实现了对音频中人声的精准提取。

团子AI的人声提取服务有哪些核心功能？

1.修复破损伴奏“脑补”丢失音色

市面其他算法只考虑如何“删除”人声,但没人关心删掉人声后，剩下的伴奏会像是“破洞”一样发闷失真,团子更在意音质，首创 AI 缺陷修复模块，不但会删除，而且能“修复”。修复被人声遮挡导致残破或丢失的乐器部位，将已损伤音色“脑补”回来，还原音色清脆感

2. 保护伴奏能量,杜绝其他算法出现的“不自然感”

不同的词语和发音方法，会让人在唱歌时声音会“忽大忽小”，而仅仅删掉这些动态人声，留下的伴奏会因为人声音量的变化导致缺损，导致伴奏听起来有“瞬态损坏不平滑”、“乐器突然发闷”等不自然感，团子独家 AI 心理声学瞬态感知模块，和人耳一样智能寻找“不自然”的瞬态区域，“抹平”修复音量缺陷区域，伴奏流畅自然。

3. 0 伪影，0 人声残留,还原清澈干净伴奏

市面主流算法（如Demucs、MDX-NET等）均有相同缺点，在许多钢琴曲、温柔抒情等伴奏音量较小音乐中，因算法缺陷会出现特别明显的伪影（类似高频滋滋声音）和人声明显残留，团子独家 WMIR 零伪影输出模块，搭配超越其他算法 8 倍分辨率的超清提取能力，每次提取像是手术一样精密，为您提供实打实的商业级伴奏音质。

4.更懂各式音乐风格

AI 在提取某种风格的音乐之前，首先需要“学习”大量类似风格的音乐样本，这样才能“理解”相似风格的音乐并知道该如何提取，10.0 算法中我们再次增加 30% 训练数据，提取更加游刃有余。

团子AI的人声提取服务的核心优势是什么？


人工智能 ARTIFICIAL INTELLIGENCE 团子是先进的人工神经网络，通过大量歌曲的训练，它像是人脑一样理解任何风格的歌曲并从中获得人声和伴奏	音质至上 QUALITY FOCUSED 对浑浊发闷、人声提取不干净的音质零容忍？团子也是。提升音质是团子的核心理念，试试团子AI实验室自研顶级算法，音质清晰流畅	简单快速 SIMPLE AND FAST 零门槛一键上传，依靠我们多台高性能服务器集群算力，无需排队，1分钟即可生成完毕。做伴奏不用求人。快，简单，而且好

在哪些场景会用到团子AI的人声提取服务？

1.卡拉OK和歌曲制作

在卡拉OK系统或音乐制作中，可能需要从原始歌曲中分离出主唱的人声，以便用户可以选择是否播放伴奏或伴奏加人声的版本。这种服务可以帮助制作出清晰的人声版本，提升用户体验和音乐品质。

2. 语音和音乐分离
在视频制作或多媒体内容创作中，需要将背景音乐与说话者的语音分离开来，以便在后期处理中进行混音调整或者强调特定的音频元素。这种服务可以有效地帮助实现这一需求。

3. 广播和讲话录音处理
在广播电台、演讲录音或会议记录中，需要从环境噪声和背景音乐中分离出主讲人的清晰声音。这种服务可以提高录音的清晰度和可听性，帮助听众更好地理解和回顾重要讲话内容。

4. 音频修复和增强
对于老旧音频记录或者质量不佳的音频文件，可能需要提取和修复人声部分，以便重新发行或用于文化遗产保护。该服务可以在音频修复和增强过程中发挥关键作用。

产品价格

适用范围：

个人&企业

免费方式：

不提供

定价方式：

商务咨询

价格：

0元起

价格详情：

单次充值金额	获得点数	额外赠送比例
10元	+ 105点付费点数（100点 + 赠送5点） + 105点免费点数	5%
25元	+ 278点付费点数（250点 + 赠送28点） + 278点免费点数	11%
50元	+ 600点付费点数（500点 + 赠送100点） + 600点免费点数	20%
3000元	+ 39000点付费点数（30000点 + 赠送9000点） + 0 免费点数（不赠送免费点数）	30%
10000元	+ 150000点（100000点 + 赠送50000点） + 0 免费点数（不赠送免费点数）	50%

使用指南

1. 使用场景和限制

#使用场景（仅供参考）

某音乐软件使用团子的“伴奏提取”功能，处理了大量歌曲，将其数据库内的歌曲提前消音化，并在此之上提供“K歌”功能。
某提供伴奏制作的工作室网站，对接了团子的 API 服务，并在此之上二次包装，并自己定制收费规则，来达到盈利的效果。

#限制

由于团子伴奏提取的 AI 系统极其复杂，不支持对实时性要求较高的业务，适合需要处理大量音乐文件并转为伴奏、且对实时性要求不强的的业务，因为AI需要载入一整首歌曲来进行学习处理（AI的注意力机制），无法把歌曲进行分割，否则可能出现每一段的处理效果都不同的问题。
请勿过快调用接口，以免被自动限制，本页面全部接口限制最大QPS（每秒可调用接口次数）：5次

#2. 创建上传通道

在使用团子上传歌曲之前，你必须创建一条临时一次性的上传通道（channel），你可以在通道里提交即将上传的文件的选项，当服务器确认无误后将返回该通道的信息，持有这些信息就可以上传歌曲了。

创建通道不会扣费，只会预测余额是否不足且传递一些配置信息。

指南详情链接：https://tuanziai.com/doc/vocal-remover.html#%E4%BD%BF%E7%94%A8%E5%9C%BA%E6%99%AF%E5%92%8C%E9%99%90%E5%88%B6

关于我们

长春肉片丝瓜科技有限公司

企业

DangoAI是一家专注于人工智能在线工具的公司，提供由AI驱动的多种工具，旨在提高工作效率。这些工具经过大量训练，能够像人类一样识别、理解和处理信息。DangoAI的工具易于使用，无需复杂的学习曲线，且运行在云端，无需考虑硬件配置或下载重型软件。公司注重产品质量，追求哪怕是1%的改进。DangoAI的服务面向个人、企业和开发者，提供透明的成本、按需付费的模式，以及无需排队的即时处理能力。此外，还提供简单、安全、易用的API接口，方便企业和开发者轻松集成到他们的产品中。

联系信息

服务时间： 0:00 - 24:00

网页在线客服：咨询

最可能同场景使用的其他API

语音审核通用API

【更新时间：2024.08.12】语音审核API服务为实时音频流内容审核提供解决方案，支持涉政、色情、广告等内容的识别，保障平台内容合规。

安全服务 > 业务安全

105

多说话人声纹分割聚类-声智科技专用API

【更新时间：2024.08.12】多说话人声纹分割聚类，能够依据音频中存在的多个说话人的声纹，实现对音频的精准切分，同时还可以将单一说话人的音频内容进行有效聚合，从而为相关处理提供极大的便利与支持。

AI技术 > AI语音 > 音频编辑

240

手机播放-neutrinoapi 专用API

【更新时间：2024.08.12】手机播放-neutrinoapi 这项服务，其具备强大功能，能够自动拨打任何有效的电话号码，然后精准地播放音频消息，实现高效的信息传递，为相关应用场景提供了便捷且实用的服务支持。

沟通与链接 > 短信

Sonix自动化转录专用API

【更新时间：2024.08.12】49种以上语言的精确语音到文本。非常适合会议、讲座、采访、电影.任何类型的音频或视频。Sonix的浏览器内编辑器允许您在任何设备上的任何地方搜索、播放、编辑、组织和共享您的成绩单。

AI技术 > AI办公

智能音频标签识别-数美专用API

【更新时间：2024.08.12】智能音频标签识别是基于大数据和机器学习技术，提供音频信息的精准识别和实时标签返回服务，为音频的智能推荐、分类和管理提供底层基础，更支持个性化的定制服务

智能识别 > 打标签