图片理解-科大讯飞

图片理解-科大讯飞

专用API
【更新时间: 2024.07.02】 科大讯飞-图片理解 API,当用户输入一张图片以及相关问题时,它能够精准地识别出图片里的对象、场景等具体信息,进而依据这些信息为用户的问题提供准确的回答,帮助用户更好地理解和处理图片相关内容。
服务星级:2星
⭐ ⭐ 🌟 🌟 🌟 🌟 🌟
调用次数
0
集成人数
0
商用人数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是图片理解-科大讯飞?

科大讯飞-图片理解用户输入一张图片和问题,从而识别出图片中的对象、场景等信息回答用户的问题。

什么是图片理解-科大讯飞接口?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用图片理解-科大讯飞,从而实现程序的自动化交互,提高服务效率。

图片理解-科大讯飞有哪些核心功能?

  1. 对象识别:能够识别图片中的各类物体,包括但不限于人、动物、物品等,并提取出这些物体的相关信息。

  2. 场景理解:不仅能够识别图片中的对象,还能进一步理解图片中的场景和环境。这包括识别图片拍摄的时间(如白天、夜晚)、地点(如室内、室外、特定地标等)以及天气条件(如晴天、雨天、雪天等)。

  3. 问题回答:基于用户输入的问题和图片理解的结果,能够生成回答或提供相关信息。这要求系统能够理解用户问题的意图,并将图片信息与问题结合起来给出答案。

  4. 高效的图片分类:系统可以根据物体的属性和特征对图片进行自动分类,这对于大量图片的整理、检索和管理非常有用。

  5. 特征提取:从图片中提取出关键的特征信息,如颜色、形状、纹理等,这些特征信息在后续的图像处理和分析中非常重要。

图片理解-科大讯飞的核心优势是什么?

高精度识别
采用先进的算法和模型,可以实现对图片的高精度识别和解析,从而更准确地提取图片中的信息
 
强大的场景理解
除了对象识别外,我还可以理解图片中的场景和环境,可以识别出图片拍摄的时间、地点以及天气条件等信息
高效的图片分类
根据物体的属性和特征对图片进行分类,有助于您快速地对大量图片进行整理和检索

在哪些场景会用到图片理解-科大讯飞接口?

 
智能家居
用户可以通过手机拍摄家中的物品,然后通过图片识别API识别出物品的名称和相关信息
 
 
自动驾驶
图片理解API可以帮助自动驾驶汽车识别路标、行人、车辆等信息,从而提高驾驶安全性
 
 
安全监控
通过图片理解API自动检测和识别特定对象或行为,如火焰、入侵者等,从而实现预警、告警功能
 
媒体和娱乐
可用于媒体娱乐领域,自动识别电影、综艺节目等场景中的人物、物品等,为影视分析、推荐等功能提供支持
<
产品价格
>

<
使用指南
>

第一步:注册成为开发者

进入讯飞开放平台快捷登录页 ,通过微信扫码、手机快捷登录,即可快速成为讯飞开放平台注册开发者。或进入讯飞开放平台注册页注册完整的开放平台账号,成为讯飞开放平台注册开发者

第二步:创建您的第一个应用,开始使用服务

登录平台后,通过右上角「控制台」,或右上角下拉菜单的「我的应用」进入控制台。若您的账户未曾创建过应用,我们会引导您创建您的第一个应用。

 

请为您的应用起一个名字,并填写相关的信息。点击提交按钮后,应用就创建完毕。

请注意在旧版本的控制台中,需要指定一个应用的操作系统平台类型,用于后续的SDK或API接入。而新版本更新后,这项操作已经不需要,可以通过一个应用管理全部的接口了。

应用创建完成之后,您就可以通过左侧的服务列表,选择您要使用的服务。在服务管理面板中,您将看到这个服务对应的可用量、历史用量、服务接口的验证信息,还有可以调用的API和SDK了。

请注意并不是每个服务的管理面板都相同,不同的服务,有不同的管理面板的构成。另外也不是同时都具有SDK和API接口,有些服务只有API接口,而有些服务只有SDK。具体的可在对应的服务管理页中查看。
 
讯飞开放平台支持一个账户创建多个应用。当您需要返回应用列表页切换应用,可以点击页面左上角应用名称上方的返回按钮,或顶部右侧个人菜单中的「我的应用」。进入应用列表后,选择一个应用点击应用名称,即可进入这个应用对应的服务管理页。

同一个应用APPID可以用在多个业务上,这个没有限制,但考虑到多个业务共用一个APPID无法分业务统计用量,建议一个业务对应一个应用APPID。

请注意若您的账号下有多个应用,您最后一次操作的应用将会被记录下来,作为下次回到讯飞开放平台时,各个服务操作的“默认选择”的应用。

第三步:获取API接口或下载SDK体验测试

在进入控制台对应的服务管理页之后,您就可以通过下载SDK或者获取WebAPI接口,接入AI服务做测试了。

  • 如果您的应用需要SDK方式的接入(包括Android,iOS,Linux等),您可以通过服务管理页SDK版块的「下载」,直接下载相应的SDK,通过「文档」,查阅开发文档。

讯飞语音SDK也支持多种能力的打包组合,若有需要请前往聚合SDK下载页下载组合SDK。在聚合SDK下载页,选择好应用和需要的平台,即可下载多功能组合的SDK包。

  • 如果您的应用需要API方式的接入,您可以通过服务管理页API版块,查看具体的调用接口,并通过「文档」,查阅开发文档。

第四步:完成实名认证

在您完成接入阶段的调试后,若您需要正式商用您的应用,需要先通过实名认证。并且,请准确选择主体的信息,企业用户不能以个人身份认证。

实名认证的可通过以下入口进入:

 

第五步:申请或购买正式服务量

完成实名认证后,针对不同的业务,您需要购买正式的AI服务交互量装机量或者是提高免费额度,才可以正式上线应用。不同的业务商业模式稍有不同,可在各自产品详情页中查看。

<
产品问答
>
?
图片理解的主要功能是什么?
用户输入一张图片和问题,从而识别出图片中的对象、场景等信息回答用户的问题。
?
图片理解支持什么语言?
目前仅支持中文。
?
图片理解对图像有什么要求?
仅支持一张图片,支持多轮文本问题,一张图片的大小限制在4M以内。
?
图片理解支持什么应用平台?
目前支持WebAPI应用平台。
?
新用户指引
https://passport.xfyun.cn/login
?
开发资料库
https://www.xfyun.cn/doc/
?
星火大模型怎么领取免费测试包
https://xinghuo.xfyun.cn/sparkapi
?
内容审核解决方案
https://zj.xfyun.cn/
?
多语种出海服务列表
https://global.xfyun.cn/products/speech-to-text
?
错误码查询
https://www.xfyun.cn/document/error-code
?
教学视频
https://www.aidaxue.com/course/courseList
<
关于我们
>
科大讯飞股份有限公司(iFLYTEK Co., Ltd.)成立于1999年,总部位于中国安徽省合肥市。作为中国领先的智能语音和人工智能技术公司,科大讯飞致力于智能语音、人工智能、大数据等领域的研究与开发。公司业务涵盖教育、医疗、金融、汽车、智能家居等多个行业,提供语音识别、语音合成、语音评测、机器翻译等智能语音服务。科大讯飞以技术创新为核心,推动人工智能技术在各行业的应用,为社会创造更多价值。
联系信息
服务时间: 08:30-22:00
电话号码: 4000-199-199
邮箱: aiui_support@iflytek.com
QQ: 617903641
网页在线客服: 咨询

科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,一直从事智能语音、计算机视觉、自然语言处理、认知智能等人工智能核心技术研究并保持国际前沿水平。科大讯飞积极推动人工智能源头核心技术研发和产业化落地,致力于“让机器能听会说,能理解会思考,用人工智能建设美好世界”。2008年公司在深圳证券交易所挂牌上市(股票代码:002230),当前市值超过1000亿元。

作为中国人工智能“国家队”,科大讯飞承建了中国唯一的认知智能全国重点实验室和语音及语言信息处理国家工程研究中心,同时是中国语音产业联盟理事长单位、中科院人工智能产学研创新联盟理事长单位、长三角人工智能产业链联盟理事长单位。

 

核心源头技术持续取得突破:智能语音和人工智能对国家安全和产业发展有巨大意义,2019年科大讯飞被美国列入实体清单,2022年又再次被美国极限施压,但核心技术继续保持全球领先。科大讯飞始终把核心源头技术自主创新放在战略高度,每年将营业收入的20%左右用于研发,创立了人工智能发展史上的一系列里程碑:

2008年,首次让机器的语音合成超过普通人说话水平;

2012年,首次让机器的语音评测超过人类专家水平;

2015年,首次让机器的语音识别超过人类速记员水平;

2017年,“智医助理机器人”首次通过国家执业医师资格考试综合笔试测试,并超过96.3%的人类考生;

2018年,首次让机器翻译的中英语音翻译达到CATTI全国翻译专业资格(水平)考试二级合格标准;

2019年,首次在国际权威的机器阅读理解SQuAD2.0比赛中超过人类平均水平;

2022年,首次在OpenBookQA知识推理挑战赛中单模型超过人类平均水平。

2023年,建设首个全国产算力平台“飞星一号”,并发布全链条自主可控的“讯飞星火大模型”。

 

基于国产算力训练的讯飞星火大模型国内领先:依托认知智能全国重点实验室的技术和应用积累,以及成建制的研发团队,2023年5月6日,科大讯飞正式对外发布讯飞星火大模型(下文简称“讯飞星火”),讯飞星火具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大核心能力。2023年10月24日,科大讯飞与华为联合发布了国内首个全国产算力平台“飞星一号”,当前训练效率已经达到英伟达A100同等规模集群的90%。2024年1月30日,首个基于全国产算力平台“飞星一号”训练的全民开放大模型——讯飞星火V3.5正式发布,测评显示,讯飞星火V3.5的语言理解、数学能力、语音交互能力已超过GPT-4 Turbo,综合能力逼近GPT-4 Turbo,持续赋能千行百业。在国务院发展研究中心、新华社研究院、《麻省理工科技商业评论》等权威机构的评测中,讯飞星火的综合能力在国内排名第一。目前对标GPT-4 Turbo当前能力的讯飞星火V4.0正在训练中,2024年6月27日正式发布。

 

在人工智能产业化方面:基于人工智能核心技术,科大讯飞多年来持续赋能教育、医疗、金融、汽车、城市、运营商、工业等行业赛道并取得广泛成效,持续助力民生和产业高质量发展。

在教育领域,科大讯飞为全国32个省级行政区、5万余所学校、1.3亿师生提供智慧教育产品和解决方案,以人工智能助力因材施教;

在医疗领域,科大讯飞“智医助理”为全国30多个省400多个区县提供7.4亿次辅诊服务,为每个医生打造AI诊疗助理、为每个居民打造AI健康助手;

在金融领域,科大讯飞为包括6大国有银行在内的全国两百多家金融机构提供智能客服、智慧营销、软件开发等AI服务,触达用户超过5亿人,用AI为客户提升服务效率和运营效能。

在汽车领域,科大讯飞为奇瑞、广汽、长安、长城等数十家车企提供累计5700万前装搭载,覆盖23个语种,助力国内车企出海,平均月活用户超过2500万,年在线交互次数突破100亿次,用AI为用户带来智能音效、智能座舱、智能驾驶等智能车载解决方案。

在城市领域,科大讯飞为全国30多个省330多个城市提供城市超脑、智慧政务等智慧城市解决方案,服务了全国超4900家政企单位,助力城市实现数字化转型。

在运营商领域,科大讯飞为全国31个省提供智慧家庭服务,日语音交互次数达8000万次,联合中国移动打造5G新通话创新应用,将为7.5亿用户提供商务速记、AI秘书等AI通话解决方案。

在工业领域,科大讯飞为全国10个省20多个地市提供基于“工业六感”技术、羚羊工业大模型技术的工业AI产品与解决方案。目前,在能源、高端装备等场景陆续打造出工业行业示范应用。

此外,讯飞星火发布以来,已在讯飞AI学习机、讯飞智能办公本、讯飞听见APP、星火语伴APP、iFlyCode智能编程助手、星火科研助手、讯飞晓医等C端软硬件,以及教育、医疗、汽车、金融、工业等B端业务赛道全面落地应用。在C端,搭载了讯飞星火的AI学习机、智能办公本、翻译机、录音笔拿下2023年“双11”京东&天猫7个品类销售冠军,讯飞AI硬件销售额同比2022年增长126%。在B端,科大讯飞联合金融、汽车、运营商、工业、住建、物业、法律、科技文献、传媒、政务、文旅、水利等12个行业龙头发布行业大模型,与华为、中国移动、中国一汽、奇瑞、太平洋保险、国能集团、交通银行、国家博物馆、中国教科院等行业龙头进行深度战略合作,持续创造刚需场景价值,加速产业化落地。

 

产业生态蓬勃发展:科大讯飞承建的智能语音国家人工智能开放创新平台,是国家首批四大新一代人工智能开放创新平台之一。截至2024年5月31日,讯飞开放平台已开放707项AI产品及能力,聚集超过683.1万开发者团队,总应用数超过240.5万,累计覆盖终端设备数超过40.5亿,AI大学堂学员总量达到77.9万,链接超过500万生态伙伴。

2023年5月6日,讯飞星火正式发布以来,已新增超过273万开发者,其中大模型直接相关的开发者数量超过52万,企业级用户超过32万。2024年1月30日,星火开源-13B正式在华为昇思开源社区联合首发上线,这是业界首个基于全国产算力平台“飞星一号”研发的开源大模型。目前,讯飞星火拥有2400多万用户,用户已开发出约9.1万个AI助手。以科大讯飞为核心的人工智能产业生态持续构建。

 

用AI践行ESG:在基础教育方面,2022年以来,科大讯飞携手学习强国,将装满AI知识和应用的“科技大篷车”开进全国15个省、72个站点,跨越2.5万公里为全国52万中小学生送去一个个“移动的AI科普课堂”。

    在基层医疗方面,科大讯飞“智医助理”帮助全国基层医护人员提供了7.4亿+次AI辅助诊疗建议,规范了2.8亿+份电子病历,纠正了130万+诊断案例,帮助基层医生降低漏诊误诊和不合理用药的风险。

在科技减贫方面,科大讯飞在贵州大方县等地建设智慧就业车间,通过就业带动产业发展,入选原国务院扶贫办培训班典型案例,通过持续“造血”,发挥带头作用,助力乡村振兴。

在文化传承方面,讯飞输入法2017年开始发起“方言保护计划”,和用户共建中国方言库,至今,讯飞输入法可以支持26种方言、5种民族语言的语音输入和2种方言的翻译。

    在科技助残方面,科大讯飞用AI帮助视听障人士无障碍沟通:讯飞听见已为听障群体提供超过1亿分钟无偿转写服务,讯飞开放平台每天为视听障人士提供超5000万次AI服务,帮助开发者开发出2.9万个无障碍应用。

在世界盛会方面,作为北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商、2023年成都第31届世界大学生夏季运动会自动语音转换与翻译类官方独家供应商,以及2023年布达佩斯世界田径锦标赛赛事供应商,科大讯飞用AI帮助全世界讲不同语言的人们无障碍沟通,并牵头发布布达佩斯人工智能联合开放平台,构建全球多语种技术生态,凝聚全球科技力量服务全球人民。

 

合作伙伴

<
最可能同场景使用的其他API
>
API接口列表
<
产品价格
>

<
使用指南
>

第一步:注册成为开发者

进入讯飞开放平台快捷登录页 ,通过微信扫码、手机快捷登录,即可快速成为讯飞开放平台注册开发者。或进入讯飞开放平台注册页注册完整的开放平台账号,成为讯飞开放平台注册开发者

第二步:创建您的第一个应用,开始使用服务

登录平台后,通过右上角「控制台」,或右上角下拉菜单的「我的应用」进入控制台。若您的账户未曾创建过应用,我们会引导您创建您的第一个应用。

 

请为您的应用起一个名字,并填写相关的信息。点击提交按钮后,应用就创建完毕。

请注意在旧版本的控制台中,需要指定一个应用的操作系统平台类型,用于后续的SDK或API接入。而新版本更新后,这项操作已经不需要,可以通过一个应用管理全部的接口了。

应用创建完成之后,您就可以通过左侧的服务列表,选择您要使用的服务。在服务管理面板中,您将看到这个服务对应的可用量、历史用量、服务接口的验证信息,还有可以调用的API和SDK了。

请注意并不是每个服务的管理面板都相同,不同的服务,有不同的管理面板的构成。另外也不是同时都具有SDK和API接口,有些服务只有API接口,而有些服务只有SDK。具体的可在对应的服务管理页中查看。
 
讯飞开放平台支持一个账户创建多个应用。当您需要返回应用列表页切换应用,可以点击页面左上角应用名称上方的返回按钮,或顶部右侧个人菜单中的「我的应用」。进入应用列表后,选择一个应用点击应用名称,即可进入这个应用对应的服务管理页。

同一个应用APPID可以用在多个业务上,这个没有限制,但考虑到多个业务共用一个APPID无法分业务统计用量,建议一个业务对应一个应用APPID。

请注意若您的账号下有多个应用,您最后一次操作的应用将会被记录下来,作为下次回到讯飞开放平台时,各个服务操作的“默认选择”的应用。

第三步:获取API接口或下载SDK体验测试

在进入控制台对应的服务管理页之后,您就可以通过下载SDK或者获取WebAPI接口,接入AI服务做测试了。

  • 如果您的应用需要SDK方式的接入(包括Android,iOS,Linux等),您可以通过服务管理页SDK版块的「下载」,直接下载相应的SDK,通过「文档」,查阅开发文档。

讯飞语音SDK也支持多种能力的打包组合,若有需要请前往聚合SDK下载页下载组合SDK。在聚合SDK下载页,选择好应用和需要的平台,即可下载多功能组合的SDK包。

  • 如果您的应用需要API方式的接入,您可以通过服务管理页API版块,查看具体的调用接口,并通过「文档」,查阅开发文档。

第四步:完成实名认证

在您完成接入阶段的调试后,若您需要正式商用您的应用,需要先通过实名认证。并且,请准确选择主体的信息,企业用户不能以个人身份认证。

实名认证的可通过以下入口进入:

 

第五步:申请或购买正式服务量

完成实名认证后,针对不同的业务,您需要购买正式的AI服务交互量装机量或者是提高免费额度,才可以正式上线应用。不同的业务商业模式稍有不同,可在各自产品详情页中查看。

<
依赖服务
>
<
产品问答
>
?
图片理解的主要功能是什么?
用户输入一张图片和问题,从而识别出图片中的对象、场景等信息回答用户的问题。
?
图片理解支持什么语言?
目前仅支持中文。
?
图片理解对图像有什么要求?
仅支持一张图片,支持多轮文本问题,一张图片的大小限制在4M以内。
?
图片理解支持什么应用平台?
目前支持WebAPI应用平台。
?
新用户指引
https://passport.xfyun.cn/login
?
开发资料库
https://www.xfyun.cn/doc/
?
星火大模型怎么领取免费测试包
https://xinghuo.xfyun.cn/sparkapi
?
内容审核解决方案
https://zj.xfyun.cn/
?
多语种出海服务列表
https://global.xfyun.cn/products/speech-to-text
?
错误码查询
https://www.xfyun.cn/document/error-code
?
教学视频
https://www.aidaxue.com/course/courseList
<
关于我们
>
科大讯飞股份有限公司(iFLYTEK Co., Ltd.)成立于1999年,总部位于中国安徽省合肥市。作为中国领先的智能语音和人工智能技术公司,科大讯飞致力于智能语音、人工智能、大数据等领域的研究与开发。公司业务涵盖教育、医疗、金融、汽车、智能家居等多个行业,提供语音识别、语音合成、语音评测、机器翻译等智能语音服务。科大讯飞以技术创新为核心,推动人工智能技术在各行业的应用,为社会创造更多价值。
联系信息
服务时间: 08:30-22:00
电话号码: 4000-199-199
邮箱: aiui_support@iflytek.com
QQ: 617903641
网页在线客服: 咨询

科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,一直从事智能语音、计算机视觉、自然语言处理、认知智能等人工智能核心技术研究并保持国际前沿水平。科大讯飞积极推动人工智能源头核心技术研发和产业化落地,致力于“让机器能听会说,能理解会思考,用人工智能建设美好世界”。2008年公司在深圳证券交易所挂牌上市(股票代码:002230),当前市值超过1000亿元。

作为中国人工智能“国家队”,科大讯飞承建了中国唯一的认知智能全国重点实验室和语音及语言信息处理国家工程研究中心,同时是中国语音产业联盟理事长单位、中科院人工智能产学研创新联盟理事长单位、长三角人工智能产业链联盟理事长单位。

 

核心源头技术持续取得突破:智能语音和人工智能对国家安全和产业发展有巨大意义,2019年科大讯飞被美国列入实体清单,2022年又再次被美国极限施压,但核心技术继续保持全球领先。科大讯飞始终把核心源头技术自主创新放在战略高度,每年将营业收入的20%左右用于研发,创立了人工智能发展史上的一系列里程碑:

2008年,首次让机器的语音合成超过普通人说话水平;

2012年,首次让机器的语音评测超过人类专家水平;

2015年,首次让机器的语音识别超过人类速记员水平;

2017年,“智医助理机器人”首次通过国家执业医师资格考试综合笔试测试,并超过96.3%的人类考生;

2018年,首次让机器翻译的中英语音翻译达到CATTI全国翻译专业资格(水平)考试二级合格标准;

2019年,首次在国际权威的机器阅读理解SQuAD2.0比赛中超过人类平均水平;

2022年,首次在OpenBookQA知识推理挑战赛中单模型超过人类平均水平。

2023年,建设首个全国产算力平台“飞星一号”,并发布全链条自主可控的“讯飞星火大模型”。

 

基于国产算力训练的讯飞星火大模型国内领先:依托认知智能全国重点实验室的技术和应用积累,以及成建制的研发团队,2023年5月6日,科大讯飞正式对外发布讯飞星火大模型(下文简称“讯飞星火”),讯飞星火具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大核心能力。2023年10月24日,科大讯飞与华为联合发布了国内首个全国产算力平台“飞星一号”,当前训练效率已经达到英伟达A100同等规模集群的90%。2024年1月30日,首个基于全国产算力平台“飞星一号”训练的全民开放大模型——讯飞星火V3.5正式发布,测评显示,讯飞星火V3.5的语言理解、数学能力、语音交互能力已超过GPT-4 Turbo,综合能力逼近GPT-4 Turbo,持续赋能千行百业。在国务院发展研究中心、新华社研究院、《麻省理工科技商业评论》等权威机构的评测中,讯飞星火的综合能力在国内排名第一。目前对标GPT-4 Turbo当前能力的讯飞星火V4.0正在训练中,2024年6月27日正式发布。

 

在人工智能产业化方面:基于人工智能核心技术,科大讯飞多年来持续赋能教育、医疗、金融、汽车、城市、运营商、工业等行业赛道并取得广泛成效,持续助力民生和产业高质量发展。

在教育领域,科大讯飞为全国32个省级行政区、5万余所学校、1.3亿师生提供智慧教育产品和解决方案,以人工智能助力因材施教;

在医疗领域,科大讯飞“智医助理”为全国30多个省400多个区县提供7.4亿次辅诊服务,为每个医生打造AI诊疗助理、为每个居民打造AI健康助手;

在金融领域,科大讯飞为包括6大国有银行在内的全国两百多家金融机构提供智能客服、智慧营销、软件开发等AI服务,触达用户超过5亿人,用AI为客户提升服务效率和运营效能。

在汽车领域,科大讯飞为奇瑞、广汽、长安、长城等数十家车企提供累计5700万前装搭载,覆盖23个语种,助力国内车企出海,平均月活用户超过2500万,年在线交互次数突破100亿次,用AI为用户带来智能音效、智能座舱、智能驾驶等智能车载解决方案。

在城市领域,科大讯飞为全国30多个省330多个城市提供城市超脑、智慧政务等智慧城市解决方案,服务了全国超4900家政企单位,助力城市实现数字化转型。

在运营商领域,科大讯飞为全国31个省提供智慧家庭服务,日语音交互次数达8000万次,联合中国移动打造5G新通话创新应用,将为7.5亿用户提供商务速记、AI秘书等AI通话解决方案。

在工业领域,科大讯飞为全国10个省20多个地市提供基于“工业六感”技术、羚羊工业大模型技术的工业AI产品与解决方案。目前,在能源、高端装备等场景陆续打造出工业行业示范应用。

此外,讯飞星火发布以来,已在讯飞AI学习机、讯飞智能办公本、讯飞听见APP、星火语伴APP、iFlyCode智能编程助手、星火科研助手、讯飞晓医等C端软硬件,以及教育、医疗、汽车、金融、工业等B端业务赛道全面落地应用。在C端,搭载了讯飞星火的AI学习机、智能办公本、翻译机、录音笔拿下2023年“双11”京东&天猫7个品类销售冠军,讯飞AI硬件销售额同比2022年增长126%。在B端,科大讯飞联合金融、汽车、运营商、工业、住建、物业、法律、科技文献、传媒、政务、文旅、水利等12个行业龙头发布行业大模型,与华为、中国移动、中国一汽、奇瑞、太平洋保险、国能集团、交通银行、国家博物馆、中国教科院等行业龙头进行深度战略合作,持续创造刚需场景价值,加速产业化落地。

 

产业生态蓬勃发展:科大讯飞承建的智能语音国家人工智能开放创新平台,是国家首批四大新一代人工智能开放创新平台之一。截至2024年5月31日,讯飞开放平台已开放707项AI产品及能力,聚集超过683.1万开发者团队,总应用数超过240.5万,累计覆盖终端设备数超过40.5亿,AI大学堂学员总量达到77.9万,链接超过500万生态伙伴。

2023年5月6日,讯飞星火正式发布以来,已新增超过273万开发者,其中大模型直接相关的开发者数量超过52万,企业级用户超过32万。2024年1月30日,星火开源-13B正式在华为昇思开源社区联合首发上线,这是业界首个基于全国产算力平台“飞星一号”研发的开源大模型。目前,讯飞星火拥有2400多万用户,用户已开发出约9.1万个AI助手。以科大讯飞为核心的人工智能产业生态持续构建。

 

用AI践行ESG:在基础教育方面,2022年以来,科大讯飞携手学习强国,将装满AI知识和应用的“科技大篷车”开进全国15个省、72个站点,跨越2.5万公里为全国52万中小学生送去一个个“移动的AI科普课堂”。

    在基层医疗方面,科大讯飞“智医助理”帮助全国基层医护人员提供了7.4亿+次AI辅助诊疗建议,规范了2.8亿+份电子病历,纠正了130万+诊断案例,帮助基层医生降低漏诊误诊和不合理用药的风险。

在科技减贫方面,科大讯飞在贵州大方县等地建设智慧就业车间,通过就业带动产业发展,入选原国务院扶贫办培训班典型案例,通过持续“造血”,发挥带头作用,助力乡村振兴。

在文化传承方面,讯飞输入法2017年开始发起“方言保护计划”,和用户共建中国方言库,至今,讯飞输入法可以支持26种方言、5种民族语言的语音输入和2种方言的翻译。

    在科技助残方面,科大讯飞用AI帮助视听障人士无障碍沟通:讯飞听见已为听障群体提供超过1亿分钟无偿转写服务,讯飞开放平台每天为视听障人士提供超5000万次AI服务,帮助开发者开发出2.9万个无障碍应用。

在世界盛会方面,作为北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商、2023年成都第31届世界大学生夏季运动会自动语音转换与翻译类官方独家供应商,以及2023年布达佩斯世界田径锦标赛赛事供应商,科大讯飞用AI帮助全世界讲不同语言的人们无障碍沟通,并牵头发布布达佩斯人工智能联合开放平台,构建全球多语种技术生态,凝聚全球科技力量服务全球人民。

 

合作伙伴

<
最可能同场景使用的其他API
>