AIUI人机交互平台-科大讯飞
专用API
服务商:
科大讯飞股份有限公司
【更新时间: 2024.07.02】
AIUI平台以讯飞星火大模型为核心,具备多模态唤醒、虚拟人驱动、多语种识别、超拟人合成等人机交互能力。提供SDK、Websocket、硬件模组等多种集成方式,广泛应用于手机、电视、机器人、扫读笔、语音购票等智能硬件...
咨询
去服务商官网采购>
|
- API详情
- 使用指南
- 常见 FAQ
- 关于我们
- 相关推荐
什么是科大讯飞的AIUI人机交互平台?
AIUI平台以讯飞星火大模型为核心,具备多模态唤醒、虚拟人驱动、多语种识别、超拟人合成等人机交互能力。提供SDK、Websocket、硬件模组等多种集成方式,广泛应用于手机、电视、机器人、扫读笔、语音购票等智能硬件设备上。接入集成简单,硬件模组开箱即用。
什么是科大讯飞的AIUI人机交互平台?
科大讯飞的AIUI人机交互平台有哪些核心功能?
1. 大模型 内置讯飞星火大模型 供100+官方开发的技能 支持接入第三方内容信源 提供可视化编辑界面,帮助开发者自定义语音交互技能 |
|
2. 阵列声学 提供多模态降噪算法,支撑高噪场景自由交互 提供线性2/4/6麦和环形4/6麦阵列和对应的前端声学算法 解决远距离收音时波束形成、回声消除、去除混响、噪音抑制、声源定位等问题 提高远场识别的准确率 |
|
3. 语音唤醒 高唤醒率 低配置要求,超低功耗 支持200个自定义唤醒词 支持用户自定义 智能评估唤醒词质量 |
|
4. 语音识别 内置讯飞星火大模型 支持离线识别 支持流式识别,实时出字 识别结果响应时间低于200ms |
|
5. 语音合成 超拟人口语化合成 提供众多特色发音人 支持离线语音合成 |
|
6. 虚拟人驱动 支持2D、3D虚拟人 支持驱动第三方虚拟人 口唇表情及动作表达逼真 |
|
7. 语音翻译 支持在线、 离线语音翻译 支持中文与40多个外文的互译 中英翻译通过了国家六级水平考试 |
科大讯飞的AIUI人机交互平台的核心优势是什么?
大客户1V1专享服务 | 国家信息安全等级保护三级 | 可靠的SLA保障承诺 | 资深工程师专业支持 |
在哪些场景会用到科大讯飞的AIUI人机交互平台?
1. 创建应用
登陆AIUI账号,进入我的应用,点击创建应用
2. 配置语音识别
应用配置中,语种选择“中文”,方言选择“普通话”,领域选择“通用”,距离选择“近场”。
点开高级设置,勾选“识别结果优先阿拉伯数字”,手机号将优先输出阿拉伯数字格式。
热词可以提升识别率。先点击下载热词模板
,格式为每行一个词语,保存后上传到平台,20分钟生效。
3. 配置语义理解
打开语义理解,点击管理技能配置
开启需要的技能,并保存
配置技能后,可在页面右侧模拟测试
4. 配置语义后合成
主动合成(推荐)
:开发者主动调用合成接口,有云端tts(默认) 、离线tts。语义后合成
:语义理解后,系统自动根据结果合成语音。开启后,所有技能回复都会自动合成,无法控制单个技能不合成,可在语音合成配置区域中选择发音人和文本进行试听。
5. 保存配置
配置后要点击保存配置
1.每个情景的识别,语义理解配置可以都不一样。创建情景模式main后,会自动生成测试情景模式main_box。
2.测试情景模式_box的目的是为了防止编辑应用时影响线上产品效果。
3.应用审核后才能更新配置到正式情景
6. 应用审核
点击审核上线
,一般24小时内处理完
7. 应用发布上线
审核通过后,会出现更新发布
、版本管理
。
点击更新发布
,按要求填写发布信息。点击发布到线上,此时测试情景模式的配置将同步到线上,即main_box下的配置同步到main。
指南详情链接:https://aiui-doc.xf-yun.com/project-1/doc-2/
科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,一直从事智能语音、计算机视觉、自然语言处理、认知智能等人工智能核心技术研究并保持国际前沿水平。科大讯飞积极推动人工智能源头核心技术研发和产业化落地,致力于“让机器能听会说,能理解会思考,用人工智能建设美好世界”。2008年公司在深圳证券交易所挂牌上市(股票代码:002230),当前市值超过1000亿元。
作为中国人工智能“国家队”,科大讯飞承建了中国唯一的认知智能全国重点实验室和语音及语言信息处理国家工程研究中心,同时是中国语音产业联盟理事长单位、中科院人工智能产学研创新联盟理事长单位、长三角人工智能产业链联盟理事长单位。
核心源头技术持续取得突破:智能语音和人工智能对国家安全和产业发展有巨大意义,2019年科大讯飞被美国列入实体清单,2022年又再次被美国极限施压,但核心技术继续保持全球领先。科大讯飞始终把核心源头技术自主创新放在战略高度,每年将营业收入的20%左右用于研发,创立了人工智能发展史上的一系列里程碑:
2008年,首次让机器的语音合成超过普通人说话水平;
2012年,首次让机器的语音评测超过人类专家水平;
2015年,首次让机器的语音识别超过人类速记员水平;
2017年,“智医助理机器人”首次通过国家执业医师资格考试综合笔试测试,并超过96.3%的人类考生;
2018年,首次让机器翻译的中英语音翻译达到CATTI全国翻译专业资格(水平)考试二级合格标准;
2019年,首次在国际权威的机器阅读理解SQuAD2.0比赛中超过人类平均水平;
2022年,首次在OpenBookQA知识推理挑战赛中单模型超过人类平均水平。
2023年,建设首个全国产算力平台“飞星一号”,并发布全链条自主可控的“讯飞星火大模型”。
基于国产算力训练的讯飞星火大模型国内领先:依托认知智能全国重点实验室的技术和应用积累,以及成建制的研发团队,2023年5月6日,科大讯飞正式对外发布讯飞星火大模型(下文简称“讯飞星火”),讯飞星火具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大核心能力。2023年10月24日,科大讯飞与华为联合发布了国内首个全国产算力平台“飞星一号”,当前训练效率已经达到英伟达A100同等规模集群的90%。2024年1月30日,首个基于全国产算力平台“飞星一号”训练的全民开放大模型——讯飞星火V3.5正式发布,测评显示,讯飞星火V3.5的语言理解、数学能力、语音交互能力已超过GPT-4 Turbo,综合能力逼近GPT-4 Turbo,持续赋能千行百业。在国务院发展研究中心、新华社研究院、《麻省理工科技商业评论》等权威机构的评测中,讯飞星火的综合能力在国内排名第一。目前对标GPT-4 Turbo当前能力的讯飞星火V4.0正在训练中,2024年6月27日正式发布。
在人工智能产业化方面:基于人工智能核心技术,科大讯飞多年来持续赋能教育、医疗、金融、汽车、城市、运营商、工业等行业赛道并取得广泛成效,持续助力民生和产业高质量发展。
在教育领域,科大讯飞为全国32个省级行政区、5万余所学校、1.3亿师生提供智慧教育产品和解决方案,以人工智能助力因材施教;
在医疗领域,科大讯飞“智医助理”为全国30多个省400多个区县提供7.4亿次辅诊服务,为每个医生打造AI诊疗助理、为每个居民打造AI健康助手;
在金融领域,科大讯飞为包括6大国有银行在内的全国两百多家金融机构提供智能客服、智慧营销、软件开发等AI服务,触达用户超过5亿人,用AI为客户提升服务效率和运营效能。
在汽车领域,科大讯飞为奇瑞、广汽、长安、长城等数十家车企提供累计5700万前装搭载,覆盖23个语种,助力国内车企出海,平均月活用户超过2500万,年在线交互次数突破100亿次,用AI为用户带来智能音效、智能座舱、智能驾驶等智能车载解决方案。
在城市领域,科大讯飞为全国30多个省330多个城市提供城市超脑、智慧政务等智慧城市解决方案,服务了全国超4900家政企单位,助力城市实现数字化转型。
在运营商领域,科大讯飞为全国31个省提供智慧家庭服务,日语音交互次数达8000万次,联合中国移动打造5G新通话创新应用,将为7.5亿用户提供商务速记、AI秘书等AI通话解决方案。
在工业领域,科大讯飞为全国10个省20多个地市提供基于“工业六感”技术、羚羊工业大模型技术的工业AI产品与解决方案。目前,在能源、高端装备等场景陆续打造出工业行业示范应用。
此外,讯飞星火发布以来,已在讯飞AI学习机、讯飞智能办公本、讯飞听见APP、星火语伴APP、iFlyCode智能编程助手、星火科研助手、讯飞晓医等C端软硬件,以及教育、医疗、汽车、金融、工业等B端业务赛道全面落地应用。在C端,搭载了讯飞星火的AI学习机、智能办公本、翻译机、录音笔拿下2023年“双11”京东&天猫7个品类销售冠军,讯飞AI硬件销售额同比2022年增长126%。在B端,科大讯飞联合金融、汽车、运营商、工业、住建、物业、法律、科技文献、传媒、政务、文旅、水利等12个行业龙头发布行业大模型,与华为、中国移动、中国一汽、奇瑞、太平洋保险、国能集团、交通银行、国家博物馆、中国教科院等行业龙头进行深度战略合作,持续创造刚需场景价值,加速产业化落地。
产业生态蓬勃发展:科大讯飞承建的智能语音国家人工智能开放创新平台,是国家首批四大新一代人工智能开放创新平台之一。截至2024年5月31日,讯飞开放平台已开放707项AI产品及能力,聚集超过683.1万开发者团队,总应用数超过240.5万,累计覆盖终端设备数超过40.5亿,AI大学堂学员总量达到77.9万,链接超过500万生态伙伴。
2023年5月6日,讯飞星火正式发布以来,已新增超过273万开发者,其中大模型直接相关的开发者数量超过52万,企业级用户超过32万。2024年1月30日,星火开源-13B正式在华为昇思开源社区联合首发上线,这是业界首个基于全国产算力平台“飞星一号”研发的开源大模型。目前,讯飞星火拥有2400多万用户,用户已开发出约9.1万个AI助手。以科大讯飞为核心的人工智能产业生态持续构建。
用AI践行ESG:在基础教育方面,2022年以来,科大讯飞携手学习强国,将装满AI知识和应用的“科技大篷车”开进全国15个省、72个站点,跨越2.5万公里为全国52万中小学生送去一个个“移动的AI科普课堂”。
在基层医疗方面,科大讯飞“智医助理”帮助全国基层医护人员提供了7.4亿+次AI辅助诊疗建议,规范了2.8亿+份电子病历,纠正了130万+诊断案例,帮助基层医生降低漏诊误诊和不合理用药的风险。
在科技减贫方面,科大讯飞在贵州大方县等地建设智慧就业车间,通过就业带动产业发展,入选原国务院扶贫办培训班典型案例,通过持续“造血”,发挥带头作用,助力乡村振兴。
在文化传承方面,讯飞输入法2017年开始发起“方言保护计划”,和用户共建中国方言库,至今,讯飞输入法可以支持26种方言、5种民族语言的语音输入和2种方言的翻译。
在科技助残方面,科大讯飞用AI帮助视听障人士无障碍沟通:讯飞听见已为听障群体提供超过1亿分钟无偿转写服务,讯飞开放平台每天为视听障人士提供超5000万次AI服务,帮助开发者开发出2.9万个无障碍应用。
在世界盛会方面,作为北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商、2023年成都第31届世界大学生夏季运动会自动语音转换与翻译类官方独家供应商,以及2023年布达佩斯世界田径锦标赛赛事供应商,科大讯飞用AI帮助全世界讲不同语言的人们无障碍沟通,并牵头发布布达佩斯人工智能联合开放平台,构建全球多语种技术生态,凝聚全球科技力量服务全球人民。
合作伙伴
1. 创建应用
登陆AIUI账号,进入我的应用,点击创建应用
2. 配置语音识别
应用配置中,语种选择“中文”,方言选择“普通话”,领域选择“通用”,距离选择“近场”。
点开高级设置,勾选“识别结果优先阿拉伯数字”,手机号将优先输出阿拉伯数字格式。
热词可以提升识别率。先点击下载热词模板
,格式为每行一个词语,保存后上传到平台,20分钟生效。
3. 配置语义理解
打开语义理解,点击管理技能配置
开启需要的技能,并保存
配置技能后,可在页面右侧模拟测试
4. 配置语义后合成
主动合成(推荐)
:开发者主动调用合成接口,有云端tts(默认) 、离线tts。语义后合成
:语义理解后,系统自动根据结果合成语音。开启后,所有技能回复都会自动合成,无法控制单个技能不合成,可在语音合成配置区域中选择发音人和文本进行试听。
5. 保存配置
配置后要点击保存配置
1.每个情景的识别,语义理解配置可以都不一样。创建情景模式main后,会自动生成测试情景模式main_box。
2.测试情景模式_box的目的是为了防止编辑应用时影响线上产品效果。
3.应用审核后才能更新配置到正式情景
6. 应用审核
点击审核上线
,一般24小时内处理完
7. 应用发布上线
审核通过后,会出现更新发布
、版本管理
。
点击更新发布
,按要求填写发布信息。点击发布到线上,此时测试情景模式的配置将同步到线上,即main_box下的配置同步到main。
指南详情链接:https://aiui-doc.xf-yun.com/project-1/doc-2/
科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,一直从事智能语音、计算机视觉、自然语言处理、认知智能等人工智能核心技术研究并保持国际前沿水平。科大讯飞积极推动人工智能源头核心技术研发和产业化落地,致力于“让机器能听会说,能理解会思考,用人工智能建设美好世界”。2008年公司在深圳证券交易所挂牌上市(股票代码:002230),当前市值超过1000亿元。
作为中国人工智能“国家队”,科大讯飞承建了中国唯一的认知智能全国重点实验室和语音及语言信息处理国家工程研究中心,同时是中国语音产业联盟理事长单位、中科院人工智能产学研创新联盟理事长单位、长三角人工智能产业链联盟理事长单位。
核心源头技术持续取得突破:智能语音和人工智能对国家安全和产业发展有巨大意义,2019年科大讯飞被美国列入实体清单,2022年又再次被美国极限施压,但核心技术继续保持全球领先。科大讯飞始终把核心源头技术自主创新放在战略高度,每年将营业收入的20%左右用于研发,创立了人工智能发展史上的一系列里程碑:
2008年,首次让机器的语音合成超过普通人说话水平;
2012年,首次让机器的语音评测超过人类专家水平;
2015年,首次让机器的语音识别超过人类速记员水平;
2017年,“智医助理机器人”首次通过国家执业医师资格考试综合笔试测试,并超过96.3%的人类考生;
2018年,首次让机器翻译的中英语音翻译达到CATTI全国翻译专业资格(水平)考试二级合格标准;
2019年,首次在国际权威的机器阅读理解SQuAD2.0比赛中超过人类平均水平;
2022年,首次在OpenBookQA知识推理挑战赛中单模型超过人类平均水平。
2023年,建设首个全国产算力平台“飞星一号”,并发布全链条自主可控的“讯飞星火大模型”。
基于国产算力训练的讯飞星火大模型国内领先:依托认知智能全国重点实验室的技术和应用积累,以及成建制的研发团队,2023年5月6日,科大讯飞正式对外发布讯飞星火大模型(下文简称“讯飞星火”),讯飞星火具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大核心能力。2023年10月24日,科大讯飞与华为联合发布了国内首个全国产算力平台“飞星一号”,当前训练效率已经达到英伟达A100同等规模集群的90%。2024年1月30日,首个基于全国产算力平台“飞星一号”训练的全民开放大模型——讯飞星火V3.5正式发布,测评显示,讯飞星火V3.5的语言理解、数学能力、语音交互能力已超过GPT-4 Turbo,综合能力逼近GPT-4 Turbo,持续赋能千行百业。在国务院发展研究中心、新华社研究院、《麻省理工科技商业评论》等权威机构的评测中,讯飞星火的综合能力在国内排名第一。目前对标GPT-4 Turbo当前能力的讯飞星火V4.0正在训练中,2024年6月27日正式发布。
在人工智能产业化方面:基于人工智能核心技术,科大讯飞多年来持续赋能教育、医疗、金融、汽车、城市、运营商、工业等行业赛道并取得广泛成效,持续助力民生和产业高质量发展。
在教育领域,科大讯飞为全国32个省级行政区、5万余所学校、1.3亿师生提供智慧教育产品和解决方案,以人工智能助力因材施教;
在医疗领域,科大讯飞“智医助理”为全国30多个省400多个区县提供7.4亿次辅诊服务,为每个医生打造AI诊疗助理、为每个居民打造AI健康助手;
在金融领域,科大讯飞为包括6大国有银行在内的全国两百多家金融机构提供智能客服、智慧营销、软件开发等AI服务,触达用户超过5亿人,用AI为客户提升服务效率和运营效能。
在汽车领域,科大讯飞为奇瑞、广汽、长安、长城等数十家车企提供累计5700万前装搭载,覆盖23个语种,助力国内车企出海,平均月活用户超过2500万,年在线交互次数突破100亿次,用AI为用户带来智能音效、智能座舱、智能驾驶等智能车载解决方案。
在城市领域,科大讯飞为全国30多个省330多个城市提供城市超脑、智慧政务等智慧城市解决方案,服务了全国超4900家政企单位,助力城市实现数字化转型。
在运营商领域,科大讯飞为全国31个省提供智慧家庭服务,日语音交互次数达8000万次,联合中国移动打造5G新通话创新应用,将为7.5亿用户提供商务速记、AI秘书等AI通话解决方案。
在工业领域,科大讯飞为全国10个省20多个地市提供基于“工业六感”技术、羚羊工业大模型技术的工业AI产品与解决方案。目前,在能源、高端装备等场景陆续打造出工业行业示范应用。
此外,讯飞星火发布以来,已在讯飞AI学习机、讯飞智能办公本、讯飞听见APP、星火语伴APP、iFlyCode智能编程助手、星火科研助手、讯飞晓医等C端软硬件,以及教育、医疗、汽车、金融、工业等B端业务赛道全面落地应用。在C端,搭载了讯飞星火的AI学习机、智能办公本、翻译机、录音笔拿下2023年“双11”京东&天猫7个品类销售冠军,讯飞AI硬件销售额同比2022年增长126%。在B端,科大讯飞联合金融、汽车、运营商、工业、住建、物业、法律、科技文献、传媒、政务、文旅、水利等12个行业龙头发布行业大模型,与华为、中国移动、中国一汽、奇瑞、太平洋保险、国能集团、交通银行、国家博物馆、中国教科院等行业龙头进行深度战略合作,持续创造刚需场景价值,加速产业化落地。
产业生态蓬勃发展:科大讯飞承建的智能语音国家人工智能开放创新平台,是国家首批四大新一代人工智能开放创新平台之一。截至2024年5月31日,讯飞开放平台已开放707项AI产品及能力,聚集超过683.1万开发者团队,总应用数超过240.5万,累计覆盖终端设备数超过40.5亿,AI大学堂学员总量达到77.9万,链接超过500万生态伙伴。
2023年5月6日,讯飞星火正式发布以来,已新增超过273万开发者,其中大模型直接相关的开发者数量超过52万,企业级用户超过32万。2024年1月30日,星火开源-13B正式在华为昇思开源社区联合首发上线,这是业界首个基于全国产算力平台“飞星一号”研发的开源大模型。目前,讯飞星火拥有2400多万用户,用户已开发出约9.1万个AI助手。以科大讯飞为核心的人工智能产业生态持续构建。
用AI践行ESG:在基础教育方面,2022年以来,科大讯飞携手学习强国,将装满AI知识和应用的“科技大篷车”开进全国15个省、72个站点,跨越2.5万公里为全国52万中小学生送去一个个“移动的AI科普课堂”。
在基层医疗方面,科大讯飞“智医助理”帮助全国基层医护人员提供了7.4亿+次AI辅助诊疗建议,规范了2.8亿+份电子病历,纠正了130万+诊断案例,帮助基层医生降低漏诊误诊和不合理用药的风险。
在科技减贫方面,科大讯飞在贵州大方县等地建设智慧就业车间,通过就业带动产业发展,入选原国务院扶贫办培训班典型案例,通过持续“造血”,发挥带头作用,助力乡村振兴。
在文化传承方面,讯飞输入法2017年开始发起“方言保护计划”,和用户共建中国方言库,至今,讯飞输入法可以支持26种方言、5种民族语言的语音输入和2种方言的翻译。
在科技助残方面,科大讯飞用AI帮助视听障人士无障碍沟通:讯飞听见已为听障群体提供超过1亿分钟无偿转写服务,讯飞开放平台每天为视听障人士提供超5000万次AI服务,帮助开发者开发出2.9万个无障碍应用。
在世界盛会方面,作为北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商、2023年成都第31届世界大学生夏季运动会自动语音转换与翻译类官方独家供应商,以及2023年布达佩斯世界田径锦标赛赛事供应商,科大讯飞用AI帮助全世界讲不同语言的人们无障碍沟通,并牵头发布布达佩斯人工智能联合开放平台,构建全球多语种技术生态,凝聚全球科技力量服务全球人民。
合作伙伴