AI虚拟人技术-科大讯飞

AI虚拟人技术-科大讯飞

专用API
【更新时间: 2024.07.02】 AI虚拟人技术 结合语音合成、语音识别、语义理解、图像处理、机器翻译、虚拟形象驱动等多项AI 核心技术,实现了信息播报、互动交流、业务咨询、服务导览等多项功能,满足了新闻、政企、文旅、金融等多场景的需要。
服务星级:2星
⭐ ⭐ 🌟 🌟 🌟 🌟 🌟
浏览次数
31
采购人数
1
试用次数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是科大讯飞的AI虚拟人技术?

AI虚拟人技术 结合语音合成、语音识别、语义理解、图像处理、机器翻译、虚拟形象驱动等多项AI 核心技术,实现了信息播报、互动交流、业务咨询、服务导览等多项功能,满足了新闻、政企、文旅、金融等多场景的需要。

什么是科大讯飞的AI虚拟人技术?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用科大讯飞的AI虚拟人技术,从而实现程序的自动化交互,提高服务效率。

科大讯飞的AI虚拟人技术有哪些核心功能?

  1. 信息播报与互动交流:结合语音合成、语音识别、语义理解等技术,AI虚拟人能够准确播报信息,并与用户进行自然、流畅的互动交流。

  2. 业务咨询与服务导览:该技术可应用于各种业务场景,提供咨询、导览等服务,帮助用户快速了解相关信息。

  3. 多情感表达:支持多重情感表达,如喜怒哀乐,使虚拟人具有同理心,能够与用户实现情感共鸣。

  4. 多动作支持:除了正常播报和交互动作外,该技术还为虚拟人添加了丰富的场景特性动作,使其表现更加生动自然。

  5. 精准口唇同步:AI自动预测表情、智能预测口型,并实时处理唇形,使得虚拟人的表情真实、自然生动。

  6. 多端接口与灵活部署:提供多种接入方式(如webapi、sdk等),满足各种应用场景的需求,并且可根据客户需求提供公有云或私有云等不同的部署方案。

  7. AI驱动的服务:AI技术不仅支撑了各场景的播报需要,还能够出色地完成主持、客服、陪伴、直播等交互工作,提供导航导览、业务知识、生活服务、信息查询等交互式AI服务。

  8. 行业定制化应用:该技术可根据不同行业的需求进行定制,如金融行业的数字员工、媒体行业的一站式音视频生成、企业数字化辅助、政务行业的智能政务咨询与办理、文旅行业的景区导览与IP定制等。

科大讯飞的AI虚拟人技术的核心优势是什么?

多情感
支持喜怒哀乐多重情感,使虚拟人也具有同理心,实现屏内屏外情感共鸣。
多动作
支持正常播报和交互动作,并在动作库里为各个应用场景添加了场景特性动作,使虚拟人生动自然。
精准口唇
AI 自动预测表情、智能预测口型、实时处理唇形,表情真实,自然生动。
多端接口
提供webapi、sdk等接入方式,满足小程序、app、H5等应用场景,接入更灵活更方便。
灵活部署
针对不同客户的需求,可提供公有云和私有云等不同的部署方案。
 
 
AI驱动
AI技术支撑满足各场景的播报需要,也可以出色地完成主持、客服、陪伴、直播等交互工作,提供导航导览、业务知识、生活服务、信息查询等交互式AI服务。

在哪些场景会用到科大讯飞的AI虚拟人技术?

融行业
面向金融用户可以定制专属数字员工,满足多种专属场景的交互需求,包括办理业务、日常交流、查询问题等。
媒体行业
输入文字即可一站式生成音视频,对紧急突发新闻、更新频率较高的内容播报场景,具有显著的应用效果。
企业数字化
实现45%工作自动化,辅助员工快速处理工作中复杂重复的工作,让员工从繁琐工作中解放,可以投入更多时间去创新思考。
政务行业
AI 数字员工优化标准办事流程,提供政务咨询、政务办理等常用功能,实现高效政务、智能政务。
 
 
文旅行业
针对景区文化特点定制IP,通过地图导览、动画指引等多种方法,结合AR、VR、一体机、移动端等形式给予旅客全方位帮助。
 
AI驱动
AI技术支撑满足各场景的播报需要,也可以出色地完成主持、客服、陪伴、直播等交互工作,提供导航导览、业务知识、生活服务、信息查询等交互式AI服务。
<
产品价格
>

<
使用指南
>

第一步:注册成为开发者

进入讯飞开放平台快捷登录页 ,通过微信扫码、手机快捷登录,即可快速成为讯飞开放平台注册开发者。或进入讯飞开放平台注册页注册完整的开放平台账号,成为讯飞开放平台注册开发者

第二步:创建您的第一个应用,开始使用服务

登录平台后,通过右上角「控制台」,或右上角下拉菜单的「我的应用」进入控制台。若您的账户未曾创建过应用,我们会引导您创建您的第一个应用。

 

请为您的应用起一个名字,并填写相关的信息。点击提交按钮后,应用就创建完毕。

请注意在旧版本的控制台中,需要指定一个应用的操作系统平台类型,用于后续的SDK或API接入。而新版本更新后,这项操作已经不需要,可以通过一个应用管理全部的接口了。

应用创建完成之后,您就可以通过左侧的服务列表,选择您要使用的服务。在服务管理面板中,您将看到这个服务对应的可用量、历史用量、服务接口的验证信息,还有可以调用的API和SDK了。

请注意并不是每个服务的管理面板都相同,不同的服务,有不同的管理面板的构成。另外也不是同时都具有SDK和API接口,有些服务只有API接口,而有些服务只有SDK。具体的可在对应的服务管理页中查看。
 
讯飞开放平台支持一个账户创建多个应用。当您需要返回应用列表页切换应用,可以点击页面左上角应用名称上方的返回按钮,或顶部右侧个人菜单中的「我的应用」。进入应用列表后,选择一个应用点击应用名称,即可进入这个应用对应的服务管理页。

同一个应用APPID可以用在多个业务上,这个没有限制,但考虑到多个业务共用一个APPID无法分业务统计用量,建议一个业务对应一个应用APPID。

请注意若您的账号下有多个应用,您最后一次操作的应用将会被记录下来,作为下次回到讯飞开放平台时,各个服务操作的“默认选择”的应用。

第三步:获取API接口或下载SDK体验测试

在进入控制台对应的服务管理页之后,您就可以通过下载SDK或者获取WebAPI接口,接入AI服务做测试了。

  • 如果您的应用需要SDK方式的接入(包括Android,iOS,Linux等),您可以通过服务管理页SDK版块的「下载」,直接下载相应的SDK,通过「文档」,查阅开发文档。

讯飞语音SDK也支持多种能力的打包组合,若有需要请前往聚合SDK下载页下载组合SDK。在聚合SDK下载页,选择好应用和需要的平台,即可下载多功能组合的SDK包。

  • 如果您的应用需要API方式的接入,您可以通过服务管理页API版块,查看具体的调用接口,并通过「文档」,查阅开发文档。

第四步:完成实名认证

在您完成接入阶段的调试后,若您需要正式商用您的应用,需要先通过实名认证。并且,请准确选择主体的信息,企业用户不能以个人身份认证。

实名认证的可通过以下入口进入:

 

第五步:申请或购买正式服务量

完成实名认证后,针对不同的业务,您需要购买正式的AI服务交互量装机量或者是提高免费额度,才可以正式上线应用。不同的业务商业模式稍有不同,可在各自产品详情页中查看。

<
产品问答
>
?
如何快速完成能力集成(虚拟人驱动、虚拟人语音交互全链路)?
开始集成前,添加客服企业微信号(搜索19905695535可添加企业微信),指派专业技术支持快速完成业务集成。
?
如何获取全部形象资源?可以根据自己的需求定制形象吗?支持定制哪些类型形象?
用户可以通过联系页面客服直接申请使用公共的虚拟人形象资源,也可以通过形象定制设计品牌个性化的虚拟人IP,可使用和定制的形象类型包括 2D真人、3D卡通、3D美型、3D写实等。
?
虚拟人能力可以结合哪些产品使用?
科大讯飞AI 虚拟人交互平台提供标准化的产品包括:API 接口、AI 虚拟主播音视频内容生产系统、AI 虚拟人交互系统、AI 虚拟人智能交互一体机、AI 虚拟人直播等多种软硬件产品。
?
新用户指引
https://passport.xfyun.cn/login
?
开发资料库
https://www.xfyun.cn/doc/
?
星火大模型怎么领取免费测试包
https://xinghuo.xfyun.cn/sparkapi
?
内容审核解决方案
https://zj.xfyun.cn/
?
多语种出海服务列表
https://global.xfyun.cn/products/speech-to-text
?
错误码查询
https://www.xfyun.cn/document/error-code
?
教学视频
https://www.aidaxue.com/course/courseList
<
关于我们
>
科大讯飞股份有限公司(iFLYTEK Co., Ltd.)成立于1999年,总部位于中国安徽省合肥市。作为中国领先的智能语音和人工智能技术公司,科大讯飞致力于智能语音、人工智能、大数据等领域的研究与开发。公司业务涵盖教育、医疗、金融、汽车、智能家居等多个行业,提供语音识别、语音合成、语音评测、机器翻译等智能语音服务。科大讯飞以技术创新为核心,推动人工智能技术在各行业的应用,为社会创造更多价值。
联系信息
服务时间: 08:30-22:00
电话号码: 4000-199-199
邮箱: aiui_support@iflytek.com
QQ: 617903641
网页在线客服: 咨询

科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,一直从事智能语音、计算机视觉、自然语言处理、认知智能等人工智能核心技术研究并保持国际前沿水平。科大讯飞积极推动人工智能源头核心技术研发和产业化落地,致力于“让机器能听会说,能理解会思考,用人工智能建设美好世界”。2008年公司在深圳证券交易所挂牌上市(股票代码:002230),当前市值超过1000亿元。

作为中国人工智能“国家队”,科大讯飞承建了中国唯一的认知智能全国重点实验室和语音及语言信息处理国家工程研究中心,同时是中国语音产业联盟理事长单位、中科院人工智能产学研创新联盟理事长单位、长三角人工智能产业链联盟理事长单位。

 

核心源头技术持续取得突破:智能语音和人工智能对国家安全和产业发展有巨大意义,2019年科大讯飞被美国列入实体清单,2022年又再次被美国极限施压,但核心技术继续保持全球领先。科大讯飞始终把核心源头技术自主创新放在战略高度,每年将营业收入的20%左右用于研发,创立了人工智能发展史上的一系列里程碑:

2008年,首次让机器的语音合成超过普通人说话水平;

2012年,首次让机器的语音评测超过人类专家水平;

2015年,首次让机器的语音识别超过人类速记员水平;

2017年,“智医助理机器人”首次通过国家执业医师资格考试综合笔试测试,并超过96.3%的人类考生;

2018年,首次让机器翻译的中英语音翻译达到CATTI全国翻译专业资格(水平)考试二级合格标准;

2019年,首次在国际权威的机器阅读理解SQuAD2.0比赛中超过人类平均水平;

2022年,首次在OpenBookQA知识推理挑战赛中单模型超过人类平均水平。

2023年,建设首个全国产算力平台“飞星一号”,并发布全链条自主可控的“讯飞星火大模型”。

 

基于国产算力训练的讯飞星火大模型国内领先:依托认知智能全国重点实验室的技术和应用积累,以及成建制的研发团队,2023年5月6日,科大讯飞正式对外发布讯飞星火大模型(下文简称“讯飞星火”),讯飞星火具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大核心能力。2023年10月24日,科大讯飞与华为联合发布了国内首个全国产算力平台“飞星一号”,当前训练效率已经达到英伟达A100同等规模集群的90%。2024年1月30日,首个基于全国产算力平台“飞星一号”训练的全民开放大模型——讯飞星火V3.5正式发布,测评显示,讯飞星火V3.5的语言理解、数学能力、语音交互能力已超过GPT-4 Turbo,综合能力逼近GPT-4 Turbo,持续赋能千行百业。在国务院发展研究中心、新华社研究院、《麻省理工科技商业评论》等权威机构的评测中,讯飞星火的综合能力在国内排名第一。目前对标GPT-4 Turbo当前能力的讯飞星火V4.0正在训练中,2024年6月27日正式发布。

 

在人工智能产业化方面:基于人工智能核心技术,科大讯飞多年来持续赋能教育、医疗、金融、汽车、城市、运营商、工业等行业赛道并取得广泛成效,持续助力民生和产业高质量发展。

在教育领域,科大讯飞为全国32个省级行政区、5万余所学校、1.3亿师生提供智慧教育产品和解决方案,以人工智能助力因材施教;

在医疗领域,科大讯飞“智医助理”为全国30多个省400多个区县提供7.4亿次辅诊服务,为每个医生打造AI诊疗助理、为每个居民打造AI健康助手;

在金融领域,科大讯飞为包括6大国有银行在内的全国两百多家金融机构提供智能客服、智慧营销、软件开发等AI服务,触达用户超过5亿人,用AI为客户提升服务效率和运营效能。

在汽车领域,科大讯飞为奇瑞、广汽、长安、长城等数十家车企提供累计5700万前装搭载,覆盖23个语种,助力国内车企出海,平均月活用户超过2500万,年在线交互次数突破100亿次,用AI为用户带来智能音效、智能座舱、智能驾驶等智能车载解决方案。

在城市领域,科大讯飞为全国30多个省330多个城市提供城市超脑、智慧政务等智慧城市解决方案,服务了全国超4900家政企单位,助力城市实现数字化转型。

在运营商领域,科大讯飞为全国31个省提供智慧家庭服务,日语音交互次数达8000万次,联合中国移动打造5G新通话创新应用,将为7.5亿用户提供商务速记、AI秘书等AI通话解决方案。

在工业领域,科大讯飞为全国10个省20多个地市提供基于“工业六感”技术、羚羊工业大模型技术的工业AI产品与解决方案。目前,在能源、高端装备等场景陆续打造出工业行业示范应用。

此外,讯飞星火发布以来,已在讯飞AI学习机、讯飞智能办公本、讯飞听见APP、星火语伴APP、iFlyCode智能编程助手、星火科研助手、讯飞晓医等C端软硬件,以及教育、医疗、汽车、金融、工业等B端业务赛道全面落地应用。在C端,搭载了讯飞星火的AI学习机、智能办公本、翻译机、录音笔拿下2023年“双11”京东&天猫7个品类销售冠军,讯飞AI硬件销售额同比2022年增长126%。在B端,科大讯飞联合金融、汽车、运营商、工业、住建、物业、法律、科技文献、传媒、政务、文旅、水利等12个行业龙头发布行业大模型,与华为、中国移动、中国一汽、奇瑞、太平洋保险、国能集团、交通银行、国家博物馆、中国教科院等行业龙头进行深度战略合作,持续创造刚需场景价值,加速产业化落地。

 

产业生态蓬勃发展:科大讯飞承建的智能语音国家人工智能开放创新平台,是国家首批四大新一代人工智能开放创新平台之一。截至2024年5月31日,讯飞开放平台已开放707项AI产品及能力,聚集超过683.1万开发者团队,总应用数超过240.5万,累计覆盖终端设备数超过40.5亿,AI大学堂学员总量达到77.9万,链接超过500万生态伙伴。

2023年5月6日,讯飞星火正式发布以来,已新增超过273万开发者,其中大模型直接相关的开发者数量超过52万,企业级用户超过32万。2024年1月30日,星火开源-13B正式在华为昇思开源社区联合首发上线,这是业界首个基于全国产算力平台“飞星一号”研发的开源大模型。目前,讯飞星火拥有2400多万用户,用户已开发出约9.1万个AI助手。以科大讯飞为核心的人工智能产业生态持续构建。

 

用AI践行ESG:在基础教育方面,2022年以来,科大讯飞携手学习强国,将装满AI知识和应用的“科技大篷车”开进全国15个省、72个站点,跨越2.5万公里为全国52万中小学生送去一个个“移动的AI科普课堂”。

    在基层医疗方面,科大讯飞“智医助理”帮助全国基层医护人员提供了7.4亿+次AI辅助诊疗建议,规范了2.8亿+份电子病历,纠正了130万+诊断案例,帮助基层医生降低漏诊误诊和不合理用药的风险。

在科技减贫方面,科大讯飞在贵州大方县等地建设智慧就业车间,通过就业带动产业发展,入选原国务院扶贫办培训班典型案例,通过持续“造血”,发挥带头作用,助力乡村振兴。

在文化传承方面,讯飞输入法2017年开始发起“方言保护计划”,和用户共建中国方言库,至今,讯飞输入法可以支持26种方言、5种民族语言的语音输入和2种方言的翻译。

    在科技助残方面,科大讯飞用AI帮助视听障人士无障碍沟通:讯飞听见已为听障群体提供超过1亿分钟无偿转写服务,讯飞开放平台每天为视听障人士提供超5000万次AI服务,帮助开发者开发出2.9万个无障碍应用。

在世界盛会方面,作为北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商、2023年成都第31届世界大学生夏季运动会自动语音转换与翻译类官方独家供应商,以及2023年布达佩斯世界田径锦标赛赛事供应商,科大讯飞用AI帮助全世界讲不同语言的人们无障碍沟通,并牵头发布布达佩斯人工智能联合开放平台,构建全球多语种技术生态,凝聚全球科技力量服务全球人民。

 

合作伙伴

<
最可能同场景使用的其他API
>
API接口列表
<
产品价格
>

<
使用指南
>

第一步:注册成为开发者

进入讯飞开放平台快捷登录页 ,通过微信扫码、手机快捷登录,即可快速成为讯飞开放平台注册开发者。或进入讯飞开放平台注册页注册完整的开放平台账号,成为讯飞开放平台注册开发者

第二步:创建您的第一个应用,开始使用服务

登录平台后,通过右上角「控制台」,或右上角下拉菜单的「我的应用」进入控制台。若您的账户未曾创建过应用,我们会引导您创建您的第一个应用。

 

请为您的应用起一个名字,并填写相关的信息。点击提交按钮后,应用就创建完毕。

请注意在旧版本的控制台中,需要指定一个应用的操作系统平台类型,用于后续的SDK或API接入。而新版本更新后,这项操作已经不需要,可以通过一个应用管理全部的接口了。

应用创建完成之后,您就可以通过左侧的服务列表,选择您要使用的服务。在服务管理面板中,您将看到这个服务对应的可用量、历史用量、服务接口的验证信息,还有可以调用的API和SDK了。

请注意并不是每个服务的管理面板都相同,不同的服务,有不同的管理面板的构成。另外也不是同时都具有SDK和API接口,有些服务只有API接口,而有些服务只有SDK。具体的可在对应的服务管理页中查看。
 
讯飞开放平台支持一个账户创建多个应用。当您需要返回应用列表页切换应用,可以点击页面左上角应用名称上方的返回按钮,或顶部右侧个人菜单中的「我的应用」。进入应用列表后,选择一个应用点击应用名称,即可进入这个应用对应的服务管理页。

同一个应用APPID可以用在多个业务上,这个没有限制,但考虑到多个业务共用一个APPID无法分业务统计用量,建议一个业务对应一个应用APPID。

请注意若您的账号下有多个应用,您最后一次操作的应用将会被记录下来,作为下次回到讯飞开放平台时,各个服务操作的“默认选择”的应用。

第三步:获取API接口或下载SDK体验测试

在进入控制台对应的服务管理页之后,您就可以通过下载SDK或者获取WebAPI接口,接入AI服务做测试了。

  • 如果您的应用需要SDK方式的接入(包括Android,iOS,Linux等),您可以通过服务管理页SDK版块的「下载」,直接下载相应的SDK,通过「文档」,查阅开发文档。

讯飞语音SDK也支持多种能力的打包组合,若有需要请前往聚合SDK下载页下载组合SDK。在聚合SDK下载页,选择好应用和需要的平台,即可下载多功能组合的SDK包。

  • 如果您的应用需要API方式的接入,您可以通过服务管理页API版块,查看具体的调用接口,并通过「文档」,查阅开发文档。

第四步:完成实名认证

在您完成接入阶段的调试后,若您需要正式商用您的应用,需要先通过实名认证。并且,请准确选择主体的信息,企业用户不能以个人身份认证。

实名认证的可通过以下入口进入:

 

第五步:申请或购买正式服务量

完成实名认证后,针对不同的业务,您需要购买正式的AI服务交互量装机量或者是提高免费额度,才可以正式上线应用。不同的业务商业模式稍有不同,可在各自产品详情页中查看。

<
依赖服务
>
<
产品问答
>
?
如何快速完成能力集成(虚拟人驱动、虚拟人语音交互全链路)?
开始集成前,添加客服企业微信号(搜索19905695535可添加企业微信),指派专业技术支持快速完成业务集成。
?
如何获取全部形象资源?可以根据自己的需求定制形象吗?支持定制哪些类型形象?
用户可以通过联系页面客服直接申请使用公共的虚拟人形象资源,也可以通过形象定制设计品牌个性化的虚拟人IP,可使用和定制的形象类型包括 2D真人、3D卡通、3D美型、3D写实等。
?
虚拟人能力可以结合哪些产品使用?
科大讯飞AI 虚拟人交互平台提供标准化的产品包括:API 接口、AI 虚拟主播音视频内容生产系统、AI 虚拟人交互系统、AI 虚拟人智能交互一体机、AI 虚拟人直播等多种软硬件产品。
?
新用户指引
https://passport.xfyun.cn/login
?
开发资料库
https://www.xfyun.cn/doc/
?
星火大模型怎么领取免费测试包
https://xinghuo.xfyun.cn/sparkapi
?
内容审核解决方案
https://zj.xfyun.cn/
?
多语种出海服务列表
https://global.xfyun.cn/products/speech-to-text
?
错误码查询
https://www.xfyun.cn/document/error-code
?
教学视频
https://www.aidaxue.com/course/courseList
<
关于我们
>
科大讯飞股份有限公司(iFLYTEK Co., Ltd.)成立于1999年,总部位于中国安徽省合肥市。作为中国领先的智能语音和人工智能技术公司,科大讯飞致力于智能语音、人工智能、大数据等领域的研究与开发。公司业务涵盖教育、医疗、金融、汽车、智能家居等多个行业,提供语音识别、语音合成、语音评测、机器翻译等智能语音服务。科大讯飞以技术创新为核心,推动人工智能技术在各行业的应用,为社会创造更多价值。
联系信息
服务时间: 08:30-22:00
电话号码: 4000-199-199
邮箱: aiui_support@iflytek.com
QQ: 617903641
网页在线客服: 咨询

科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,一直从事智能语音、计算机视觉、自然语言处理、认知智能等人工智能核心技术研究并保持国际前沿水平。科大讯飞积极推动人工智能源头核心技术研发和产业化落地,致力于“让机器能听会说,能理解会思考,用人工智能建设美好世界”。2008年公司在深圳证券交易所挂牌上市(股票代码:002230),当前市值超过1000亿元。

作为中国人工智能“国家队”,科大讯飞承建了中国唯一的认知智能全国重点实验室和语音及语言信息处理国家工程研究中心,同时是中国语音产业联盟理事长单位、中科院人工智能产学研创新联盟理事长单位、长三角人工智能产业链联盟理事长单位。

 

核心源头技术持续取得突破:智能语音和人工智能对国家安全和产业发展有巨大意义,2019年科大讯飞被美国列入实体清单,2022年又再次被美国极限施压,但核心技术继续保持全球领先。科大讯飞始终把核心源头技术自主创新放在战略高度,每年将营业收入的20%左右用于研发,创立了人工智能发展史上的一系列里程碑:

2008年,首次让机器的语音合成超过普通人说话水平;

2012年,首次让机器的语音评测超过人类专家水平;

2015年,首次让机器的语音识别超过人类速记员水平;

2017年,“智医助理机器人”首次通过国家执业医师资格考试综合笔试测试,并超过96.3%的人类考生;

2018年,首次让机器翻译的中英语音翻译达到CATTI全国翻译专业资格(水平)考试二级合格标准;

2019年,首次在国际权威的机器阅读理解SQuAD2.0比赛中超过人类平均水平;

2022年,首次在OpenBookQA知识推理挑战赛中单模型超过人类平均水平。

2023年,建设首个全国产算力平台“飞星一号”,并发布全链条自主可控的“讯飞星火大模型”。

 

基于国产算力训练的讯飞星火大模型国内领先:依托认知智能全国重点实验室的技术和应用积累,以及成建制的研发团队,2023年5月6日,科大讯飞正式对外发布讯飞星火大模型(下文简称“讯飞星火”),讯飞星火具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大核心能力。2023年10月24日,科大讯飞与华为联合发布了国内首个全国产算力平台“飞星一号”,当前训练效率已经达到英伟达A100同等规模集群的90%。2024年1月30日,首个基于全国产算力平台“飞星一号”训练的全民开放大模型——讯飞星火V3.5正式发布,测评显示,讯飞星火V3.5的语言理解、数学能力、语音交互能力已超过GPT-4 Turbo,综合能力逼近GPT-4 Turbo,持续赋能千行百业。在国务院发展研究中心、新华社研究院、《麻省理工科技商业评论》等权威机构的评测中,讯飞星火的综合能力在国内排名第一。目前对标GPT-4 Turbo当前能力的讯飞星火V4.0正在训练中,2024年6月27日正式发布。

 

在人工智能产业化方面:基于人工智能核心技术,科大讯飞多年来持续赋能教育、医疗、金融、汽车、城市、运营商、工业等行业赛道并取得广泛成效,持续助力民生和产业高质量发展。

在教育领域,科大讯飞为全国32个省级行政区、5万余所学校、1.3亿师生提供智慧教育产品和解决方案,以人工智能助力因材施教;

在医疗领域,科大讯飞“智医助理”为全国30多个省400多个区县提供7.4亿次辅诊服务,为每个医生打造AI诊疗助理、为每个居民打造AI健康助手;

在金融领域,科大讯飞为包括6大国有银行在内的全国两百多家金融机构提供智能客服、智慧营销、软件开发等AI服务,触达用户超过5亿人,用AI为客户提升服务效率和运营效能。

在汽车领域,科大讯飞为奇瑞、广汽、长安、长城等数十家车企提供累计5700万前装搭载,覆盖23个语种,助力国内车企出海,平均月活用户超过2500万,年在线交互次数突破100亿次,用AI为用户带来智能音效、智能座舱、智能驾驶等智能车载解决方案。

在城市领域,科大讯飞为全国30多个省330多个城市提供城市超脑、智慧政务等智慧城市解决方案,服务了全国超4900家政企单位,助力城市实现数字化转型。

在运营商领域,科大讯飞为全国31个省提供智慧家庭服务,日语音交互次数达8000万次,联合中国移动打造5G新通话创新应用,将为7.5亿用户提供商务速记、AI秘书等AI通话解决方案。

在工业领域,科大讯飞为全国10个省20多个地市提供基于“工业六感”技术、羚羊工业大模型技术的工业AI产品与解决方案。目前,在能源、高端装备等场景陆续打造出工业行业示范应用。

此外,讯飞星火发布以来,已在讯飞AI学习机、讯飞智能办公本、讯飞听见APP、星火语伴APP、iFlyCode智能编程助手、星火科研助手、讯飞晓医等C端软硬件,以及教育、医疗、汽车、金融、工业等B端业务赛道全面落地应用。在C端,搭载了讯飞星火的AI学习机、智能办公本、翻译机、录音笔拿下2023年“双11”京东&天猫7个品类销售冠军,讯飞AI硬件销售额同比2022年增长126%。在B端,科大讯飞联合金融、汽车、运营商、工业、住建、物业、法律、科技文献、传媒、政务、文旅、水利等12个行业龙头发布行业大模型,与华为、中国移动、中国一汽、奇瑞、太平洋保险、国能集团、交通银行、国家博物馆、中国教科院等行业龙头进行深度战略合作,持续创造刚需场景价值,加速产业化落地。

 

产业生态蓬勃发展:科大讯飞承建的智能语音国家人工智能开放创新平台,是国家首批四大新一代人工智能开放创新平台之一。截至2024年5月31日,讯飞开放平台已开放707项AI产品及能力,聚集超过683.1万开发者团队,总应用数超过240.5万,累计覆盖终端设备数超过40.5亿,AI大学堂学员总量达到77.9万,链接超过500万生态伙伴。

2023年5月6日,讯飞星火正式发布以来,已新增超过273万开发者,其中大模型直接相关的开发者数量超过52万,企业级用户超过32万。2024年1月30日,星火开源-13B正式在华为昇思开源社区联合首发上线,这是业界首个基于全国产算力平台“飞星一号”研发的开源大模型。目前,讯飞星火拥有2400多万用户,用户已开发出约9.1万个AI助手。以科大讯飞为核心的人工智能产业生态持续构建。

 

用AI践行ESG:在基础教育方面,2022年以来,科大讯飞携手学习强国,将装满AI知识和应用的“科技大篷车”开进全国15个省、72个站点,跨越2.5万公里为全国52万中小学生送去一个个“移动的AI科普课堂”。

    在基层医疗方面,科大讯飞“智医助理”帮助全国基层医护人员提供了7.4亿+次AI辅助诊疗建议,规范了2.8亿+份电子病历,纠正了130万+诊断案例,帮助基层医生降低漏诊误诊和不合理用药的风险。

在科技减贫方面,科大讯飞在贵州大方县等地建设智慧就业车间,通过就业带动产业发展,入选原国务院扶贫办培训班典型案例,通过持续“造血”,发挥带头作用,助力乡村振兴。

在文化传承方面,讯飞输入法2017年开始发起“方言保护计划”,和用户共建中国方言库,至今,讯飞输入法可以支持26种方言、5种民族语言的语音输入和2种方言的翻译。

    在科技助残方面,科大讯飞用AI帮助视听障人士无障碍沟通:讯飞听见已为听障群体提供超过1亿分钟无偿转写服务,讯飞开放平台每天为视听障人士提供超5000万次AI服务,帮助开发者开发出2.9万个无障碍应用。

在世界盛会方面,作为北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商、2023年成都第31届世界大学生夏季运动会自动语音转换与翻译类官方独家供应商,以及2023年布达佩斯世界田径锦标赛赛事供应商,科大讯飞用AI帮助全世界讲不同语言的人们无障碍沟通,并牵头发布布达佩斯人工智能联合开放平台,构建全球多语种技术生态,凝聚全球科技力量服务全球人民。

 

合作伙伴

<
最可能同场景使用的其他API
>