点击或拖拽图片到此处上传(最多5张)
对于不限时长的语音输入进行实时转写,能够根据用户预期进行自动断句和标点符号添加。 适用于长时间语音输入场景,例如会议记录、客服电话等。
声音理解,基于声音识别基本算法,通过机器对语音数据展开全面分析,从而准确判定发音人的性别与年龄等信息,进而实现更加精准化的信息匹配,能为相关应用提供有力的数据支持与服务。
对用户录制的语音文件进行非实时的转写处理。 适用于大量的用户语音离线转写,对实时性要求不高,例如客服电话语音质检,字幕后期制作等。