所有文章 > AI驱动 > 50+个AI大模型的应用案例,开启脑洞!
50+个AI大模型的应用案例,开启脑洞!

50+个AI大模型的应用案例,开启脑洞!

AI大模型由于其强大的自然语言与多模态信息处理能力,可以应对不同语义粒度下的任务,进行复杂的逻辑推理,还具有超强的学习能力,实现对不同领域、不同数据模式的适配。AI大模型的应用方向可从三个维度进行划分:

1、从产品形态维度,分为AIGC(内容生成)、Chatbot(聊天机器人)、Copilot(智能助手)、Insight(知识洞察)和Agent(数字代理)等重要方向。

2、从客户维度,ToB、ToG、ToC。

  • ToB场景:由于企业之间的业务差异较大,需要定制化的模型和算法,因此落地难度较大。此外,在企业内部,不同的部门之间也需要进行协调和沟通,以便更好地利用大模型提供的数据和服务。
  • ToG场景:政府在制定政策时需要依赖大量的数据和信息,因此大模型在政府领域的应用较为广泛。由于政府拥有较为完善的信息化基础设施,因此大模型的落地难度相对较低。
  • ToC场景:消费者对产品和服务的需求较为多样化,因此大模型在消费市场中的应用难度较大。此外,由于消费市场的竞争较为激烈,企业需要不断地优化产品和服务,以满足消费者的需求,这也需要大模型提供更加精准的数据分析和预测。

3、从商业模式上看,分为行业化大模型应用与 MaaS。

  • 在技术层面,微调(Fine-tuning)会是应用发展的关键。它是从传统的人工智能迈向新时代的一个标志性进步。微调的价值在于,它能够将一个通用模型转变为针对特定任务高效的专用模型。这种方法在行业应用、企业应用以及垂直领域均显示出巨大的潜力。值得注意的是,自 2023 年下半年以来,微调的成本已大幅降低,为其广泛应用铺平了道路。
  • 模型即服务(MaaS)的概念在行业内得到迅速发展,许多大型企业已在其发布会上提及这一概念。它涉及将云资源与 AI 部署相结合,使模型能够直接提供服务,这被认为是具有颠覆性的,有望重构众多应用领域。

AIGC应用案例

1、LinkedIn:为会员提供优质生成式产品

LinkedIn 聘请 LLM 向用户推荐相关的高级产品。LinkedIn 的推荐系统可以通过分析用户数据(包括职业历史、兴趣和活动模式)为会员匹配最适合其需求的高级服务和产品。

这种有针对性的方法有助于 LinkedIn 提高用户满意度并推动其高级产品的订阅。

2、Discord:生成式人工智能用例

流行的通信平台 Discord 探索了各种生成式 AI 用例,以提高用户参与度。

Discord 可以通过快速开发和集成生成式 AI 功能,为用户提供创意工具,例如 AI 生成的头像、内容审核和自动回复。这些功能利用 LLM 来改善用户体验并培养更具互动性的社区

3、格莱美奖:定制见解和内容

IBM 还宣布了一项协议,为格莱美奖的所有者录音学院提供一项名为 AI stories 的服务。该服务利用在 IBM Wastonx.ai 工作室上运行的 Llama 2,帮助定制见解和内容。这项服务将围绕艺术家及其作品的相关数据集的数据矢量化,LLM 可以通过 RAG 数据库检索这些数据,粉丝们也可以与这些内容进行互动。

4、Shopify:生成产品描述

Shopify Sidekick 是一个 AI 驱动的工具,利用 Llama 2 帮助小企业主自动完成管理其商务网站的各种任务,如生成产品描述、回应客户查询和创建营销内容。

5、Waymark&OpenAI,集成GPT-3增强和扩展视频创建

Waymark集成GPT-3后,使用微调的GPT-3模型来创建不同脚本编写体验,使得用户可以在几秒钟内收到其业务的原始自定义脚本。

对于Waymark来说,从自己动手到为您动手模式的演变提升了他们的使命,即让视频创作变得可访问。他们现在将自己定义为“世界上第一个自然语言视频创作平台”。

此项功能推出后,Waymark 客户花在编辑脚本上的时间要少得多。特别是对于与许多本地企业合作的公司来说,这是一个节省时间和成本的巨大增强功能,使他们能够更快速高效地推销、销售和支持更多的本地广告商。

6、BukiHQ Medi&fireflies.ai,有效解决公关会议记录问题

BukiHQ Medi内部数据显示,大约 15% 的会议时间被浪费,主要是由于会议设备效率低下。不仅如此,在手动做笔记时,讨论的要点经常被忽略。

为了解决这些问题,BukiHQ Medi引入了fireflies.ai(基于生成式AI技术的语音助手)的解决方案。使用fireflies.ai的AI笔记记录器,可以有效地创建会议记录 (MoM)。这减少了手动记笔记带来的许多沟通不畅和后续行动。

不仅如此,fireflies.ai机器人Fred作为参与者保持通话状态,而不会以任何方式中断会议,自动记笔记使 BukiHQ 更容易专注于讨论并节省大量时间。

7、新墨西哥州&Colossyan,视频制作效率大幅提升

新墨西哥州是美国西南部的山区州之一,人口数约200万。国家和公民之间清晰透明的沟通,对于政务治理起着至关重要的作用。新墨西哥州制作了许多教育内容,但主要是基于文本的。观看视频是该州本地人接收大量信息并遵循教学视频的首选方式。制作视频需聘请专业的视频编辑、摄制组、工作室或支持人员等,投入巨大,工期超长。

使用Colossyan的文本转视频解决方案之后,生成视频的过程就像选择头像/演员并输入内容一样简单。可以在视频中添加音乐和自定义背景,从而获得更具吸引力的学习体验。这样,他们就不需要安排演员或搭建背景来制作高质量的视频。

8、HealthifyMe&Pepper Content,应用参与度6个月飙升至90%

HealthifyMe是一个总部位于印度的健康和保健平台,十年前开始作为一个简单的应用程序,帮助用户跟踪他们的卡路里摄入量。用户可以在应用程序上浏览各种健身计划,并与来自世界各地的 2000多名营养师和教练联系,以实现他们的健身目标。

HealthifyMe采用知识分享策略,来吸引更多用户。内容模式诞生了,却遇到了新的挑战。知识分享激发了用户的兴趣和参与度,但由于内容单一,逐级让用户失去了兴趣。HealthifyMe引入了Pepper Content,将用户想法转化为精心设计的演示文稿。通过一致和简化的演示交付,HealthifyMe的平台活跃用户百分比从75%上升到90%。

9、Sabine&Synthesia,培训效率提高70%

Sabine(博西家电)集团是欧洲最大的家电制造商,拥有60000多名员工,是全球行业领先的公司之一。由于Sabine是一家知识遍布全球的全球性公司,希望确保组织中的每个人都能获得这些知识,但重要的是以有效的方式完成这项工作。

为了不受时间和空间限制地提供专业知识,电子学习的数字化是一个显而易见的选择,但Sabine的团队不想依靠无聊的PDF或幻灯片来点击。视频是首选格式,但它有许多限制:成本、灵活性、译本。

它们引入Synthesia软件,作为生成式AI视频制作平台,Sabine迅速开发了一个虚拟辅导员,以指导学习者完成培训课程。该试点取得了巨大的成功,包括:超过30000次基于Web的培训观看,电子学习的参与度提高了30%以上,节省超过 70%的外部视频制作成本。

10、Achievers&Forethought,首次联系解决率实现93%

Achievers是一个员工语音识别解决方案平台,可帮助组织建立员工敬业度和可持续绩效。Achievers的业务既有B2B也有B2B2C。在B2B2C方面,最终用户由全球客户支持团队提供支持服务。Achievers的目标是为客户提供一流的支持体验,并建立可扩展的支持团队并高效运营。

Achievers引入了用于客户支持自动化的AI生成平台Forethought,Achievers利用知识库和预构建的工作流,通过自动化小部件解决重复工单。解决即时搜索成功者的知识文章和以前解决的工单的整个数据库,以提供最准确的支持查询响应,而无需代理的干预。

11、RealDefense&Observe.AI,通过AI指导实现103%的销售配额

RealDefense为消费者和小型企业提供身份保护和实时技术支持服务。该组织拥有超过100万客户,业务遍及全球33个国家/地区。

它们引入Observe.AI智能劳动力平台,不仅让企业看到客服座席的不规范性,还提供了对客户交互的全面可见性。由生成式AI驱动的对话智能和评估分数的历史,帮助企业提高单个座席和整个团队(包括主管和QA经理)的绩效。

尝到甜头后,RealDefense开始进一步接入Observe.AI的QA评估表、情绪分析、Moments、记分卡视图、网络聊天等工具,加强其销售业绩。方案全面实施后,企业在业务绩效方面有了显著提高。以前所有代理的自动失败率为 100%,现在已改善了 90% 以上。随着团队坚持销售脚本,销售配额完成率已提高到103%。同时,该组织也建立了强大的反馈循环,可提供持续更新和可操作的信息。

12、MHI&Lumen5,扩展内容策略并加快工作流程

三菱重工(MHI)是一家总部位于东京的跨国工程和制造公司。MHI集团为电力和能源、工业机械、城市基础设施、航空航天和国防等广泛领域提供创新和集成的解决方案。

MHI引入了生成式AI视频平台Lumen5,编辑团队意识到他们不需要成为视频制作专家即可为其活动,博览会和社交媒体账户创建引人入胜的视频,业务流程效率大幅提升。

使用Lumen5不到一年,MHI发布的视频内容量是以前的五倍,从而增加了网站流量。视频获得的展示次数是其他类型内容的两倍。现在MHI在LinkedIn上分享的内容中至少有一半是Lumen5视频,大幅提高了粉丝互动的参与率。

13、借助Wordsmit,美联社自动化撰写了50000篇文章

Wordsmith使用自然语言生成将数据转化为富有洞察力、听起来像人类的叙述。就财务报告而言,Wordsmith在几秒钟内将Zacks Investment Research的收益数据转换为可发布的美联社故事。美联社现在制作了4400个季度收益故事,比其手动工作效率提升了近 15倍。

为了支持体育记者,美联社在2018赛季开始自动化NCAA一级男子篮球预览,使用Wordsmith和Stats Perform的数据为常规赛提供超过5000个预览。同样在2018赛季,美联社开始使用Wordsmith生成的NCAA一级男子篮球比赛的自动回顾。数据驱动型报道的自动化,使记者能够专注于撰写批判性的定性文章。

ChatBot应用案例

1、StarHub&Haptik,通过Haptik实现全渠道获客

StarHub是一家领先的新加坡公司,提供世界一流的通信,娱乐和数字解决方案。凭借高质量的移动和固定服务、广泛的优质内容套件以及多样化的通信解决方案,StarHub Mobile拥有超过200万客户,是新加坡第二大移动网络运营商,拥有近30%的市场份额。

StarHub与Haptik合作,在Facebook页面构建了一个智能Chatbot虚拟助手,以回答有关其数字电视,有线电视,IPTV,宽带互联网,电话和移动设备服务的查询。凭借Facebook虚拟助手获得的巨大吸引力,StarHub还在其网站和WhatsApp上启用了他们的AI助手。

方案实施后,StarHub的IVA具备了3000+独特意图,用于回答有关预付费计划、光纤宽带、品牌优惠和重新合同资格的查询。并拥有50+ 预构建旅程,帮助用户激活/停用数据旅行计划、漫游计划、故障排除指南等。

同时,StarHub在不到 6-8 个月的时间内将 NPS(即净推荐值)从-40提高到+10。显著缩短了常规查询(如帐户余额、计划、账单、新产品/服务等)的首次响应时间,客户体验大幅改进。

2、新奥集团&IBM ,Chatbot融合方案实现生产力大幅提升

新奥集团有限公司(ENN Group)致力于用当今的技术解决未来的能源挑战。这家绿色能源巨头为中国及其他80多个城市的客户提供服务,长期以来一直处于该行业技术创新的最前沿。

2020 年初,新冠疫情的爆发要求该公司的数千名办公室员工几乎在一夜之间转向在家工作。对与远程工作相关的 IT 服务的需求(例如请求 VPN 权限以及密码下载和重置)立即飙升。IT 帮助台人员不堪重负。

为解决这个难题,新奥集团推出一款新的虚拟助手,该助手结合了IBM Watson Assistant(IBM的Chatbot产品)和IBM Watson Discovery(智能搜索和文本分析平台)技术的人工智能,以解释和响应IT员工服务台请求。每天完成 2000 –3000 个任务,实施 70 多个业务场景,创造了数百万美元的价值,并将处理时间缩短了 60%。

3、索尼印度&Yellow.ai,两个月处理超2万客户电话

索尼印度是索尼公司在日本的全资子公司,是电视、数字成像、个人音频、家庭娱乐、游戏、汽车音响和专业解决方案等类别电子产品的高端品牌。

凭借不断扩大的客户群和庞大的经销商网络,索尼印度公司有大量的查询和有限的代理带宽来有效处理每个查询。在工作时间后收到的大量客户请求导致及时提供解决方案的延迟。

索尼选择了Yellow.ai为技术供应商,引入Chatbot,建立一个专门的24/7帮助热线,用于销售和服务支持,同时该解决方案还需要与索尼CRM集成。语音AI代理可以收集,记录和分析用户信息,以提供个性化体验。语音 AI 代理准确收集、记录和分析用户信息,以提供个性化体验,同时还根据 PIN 码话语识别州、城市和地区,提供基于位置的服务。

方案实施后,索尼语音AI座席每季度处理的呼叫可节省工时成本46K+,产品和演示请求的环比增加5%,提高了潜在客户,每月服务请求导致客户履行的每月服务请求达到13K+。

4、Otus&Intercom,Chatbot让客户满意度高达97%

Otus是一家教育技术公司,提供学习管理系统,帮助学生、教师、家长和管理人员。

为了给客户创造更好的体验,Otus引入了Intercom的Chatbot解决方案。

方案实施后,借助统一的客户沟通平台,Otus能够利用 Intercom 的分析(特别是对话主题和自定义报告)来了解客户的需求并庆祝团队的成功,从而创建一致的体验、更有效地协作并推动持续改进。

在客服支持方面,该团队利用自定义机器人和文章等自动化功能,实时为客户提供即时答案,并使他们能够自助服务。在机器人和自动化的帮助下,Otus 自动解决了 22.2% 的客户问题,CSAT(客户满意度)得分为 97%,客户对他们收到的快速、个性化的服务感到满意。

5、新华三&网易七鱼,终端呼叫满意度连续四月超98%

新华三智能终端有限公司,由新华三技术有限公司全资成立,致力于向小微企业和智慧家庭提供“极致用户体验”的产品及方案,业务涵盖小微商业网络、智慧家庭网络、家庭安防和企业智慧屏。目前,智能终端的产品在网运行设备数已经超过1000万。

新华三引入了网易七鱼,通过其多功能坐席,新华三将多个渠道的在线咨询汇集到一起由人工客服统一处理。基于“智能识别”的能力,七鱼辅助新华三智能终端开通了VIP 服务专线,在线加呼叫多功能坐席满足同时满足”传统用户“和”互联网用户“服务需求。

借助网易七鱼基于AI技术的在线机器人,新华三智能终端问题匹配率可高达90%以上,分流80%左右的咨询量,在线机器人高效处理流程化咨询,降低客服倦怠感。

目前,新华三智能终端客服机器人的问题解决率已经达到80%,机器人问题匹配率也达到了97%;同时云呼叫中心的应用,新华三智能终端呼叫满意度已经连续四个月保持在98%以上。

Copilot应用案例

1、GitHub Copilot

GitHub Copilot X 致力于改进开发者体验,将提供聊天和语音界面,支持拉取请求,回答文档问题,并通过 GPT-4 实现更个性化的开发者体验,包括:

  • GitHub Copilot聊天功能:在编辑器中集成与VS Code和Visual Studio的聊天界面,帮助开发者深入分析代码、生成单元测试和修复bug。
  • GitHub Copilot语音功能:允许开发者通过口头指令进行自然语言提示。为拉取请求(Pull Request)提供AI生成的描述:基于GPT-4模型生成拉取请求描述和标签。
  • 自动生成测试建议:GitHub Copilot将警告开发者测试覆盖率不足,并建议潜在的测试方案。GitHub Copilot文档功能:提供基于聊天界面的文档查询,为开发者提供实时答案。
  • GitHub Copilot CLI:为命令行界面提供智能建议。

2、Microsoft Dynamics 365 Copilot

联想,作为一家业务遍布180个国家的跨国企业,深知这一挑战对其43000名知识工作者的影响。他们渴望为每一位员工提供一个与世界同行无缝协作的平台,让知识的交流不再受地域限制。

联想为其全球业务选择了Microsoft Dynamics 365 Copilot这一革命性的人工智能解决方案。通过GenAI的强大能力,联想正在逐步破解信息管理的复杂性,免除企业员工信息过载的困扰,使他们能够更加轻松地驾驭信息洪流,在各自的岗位上更加出色地发挥才能,实现全球范围内的高效协作。

  • 65%的联想用户表示,使用Copilot 智能副驾驶® for Microsoft 365提高了工作效率
  • 52%的联想用户表示,他们每天可节省 30 分钟以上的时间
  • 每位员工每周节省9 个小时,有利于从事更有创造性的工作
  • 75% 的联想用户会推荐使用 Copilot 智能副驾驶® for Microsoft 365
  • 联想使用Copilot for Microsoft 365用户数量较项目启动之初增长了100%,扩大了采用范围

Insight应用案例

1、飞算科技 AI.Insight

AI.Insight是飞算科技推出的一款智能客户洞悉工具,针对企业数据分析与决策的痛点给出了全面的解决方案:

  • 沟通与工具割裂:AI.Insight通过自然语言交互方式,使得业务和技术人员能够快速、准确地沟通需求,降低使用门槛,减少理解偏差,实现需求的即时响应和处理。
  • 数据分析时效性低:AI.Insight利用大模型增强分析技术,能够在短时间内自助分析并定位业务问题,极大提高了数据分析的时效性。
  • 分析工具割裂:AI.Insight集成了多种分析功能,用户可以使用自然语言搜索任何问题,答案以见解、报告和推荐的仪表板形式展现,减少了对多个工具的依赖。
  • 数据整理复杂:AI.Insight的自动分析(Auto OLAP)技术帮助用户从不同角度和维度对数据进行分析,简化了数据整理过程,提高了数据的可读性和实用性。
  • 数据分析未能有效赋能业务决策:AI.Insight能够自动进行图表和报告展现,用户可以随时随地获取精准的经营数据问题回答,直接支持营销决策。

以一家西北菜连锁餐饮集团为例,该集团面临业绩下滑的挑战。通过应用AI.Insight智能决策平台,营销人员迅速分析出业绩下滑的根本原因,并在短短一个季度内实现了线上渠道复购率提升20%,GMV提升10%,有效扭转了业绩下滑趋势。

2、亚马逊:优化评论洞察分析

亚马逊的AI推荐系统简化了购物者的决策过程。该算法能够提炼共同的主题,提供对产品特性和买家评论的即时洞察。这一系统帮助用户节省了时间,使他们能够迅速判断商品是否满足自己的需求。

LLM还能够精确地识别提及特定属性的评论,进一步简化了用户购买前的产品研究过程。此外,亚马逊还十分注重产品评论的真实性,确保所有洞察均基于真实的客户体验。受益于此,客户可以更放心地在亚马逊消费。最后,AI系统还有效优化了购买流程,大大降低了购物车弃置率。

3、Zalando:实时定制化的建议

零售巨头Zalando借助其beta版本的AI助手,为时尚界带来了一场革命性的变革。该品牌坚信,由生成式AI引领的时尚潮流,将引领我们走向一个更加个性化、互动性十足的购物新纪元。他们推出了一款对话式工具,让顾客在轻松的聊天中就能发现那些与自己独特风格和需求完美契合的服饰。

Zalando将这一创新项目视为一场共同创造的旅程,他们诚邀用户参与其中,提供宝贵的反馈。通过这种开放合作的方式,虚拟助手得以不断自我进化迭代,与顾客的喜好和需求同步成长。

4、Tripadvisor:升级旅行规划

Tripadvisor最新推出的AI驱动生成器为创建旅行行程提供了强大的助力。该解决方案可以根据目的地、日期和旅行者的偏好来创建定制的路线。公司过往庞大的顾客评论和反馈数据库确保了这些推荐建议的可靠性,所以旅行者可以轻松定制他们的旅行日程,并且再次“反哺”数据库。总的来说,生成式AI确保了推荐更个性化,可以优化规划体验,提升用户参与度。

5、维珍之旅:尝试定制邀请函

在旅游业,生成式AI的运用又添一例——邮轮公司维珍之旅(Virgin Voyages)推出的“Jen AI”。这一别出心裁的策划呈现了一个由 AI驱动的虚拟詹妮弗·洛佩兹(Jennifer Lopez)形象。该技术解决方案能帮助旅行者制作个性化的邀请函,以一种令人难忘的方式集结亲朋好友。邀请函还能针对即将到来的活动,进行详尽的个性化定制。

尽管技术仍有一定的提升空间,但它也展示了生成式解决方案在动态定制互动体验方面的潜力。这种创新方法也彰显了品牌对提供有趣、引人入胜服务的坚定承诺。

Agent应用案例

1、BlackRock的Aladdin平台

BlackRock,全球首屈一式的资产管理巨头,其Aladdin平台堪称投资管理的全能助手。

Aladdin融合AI与大数据技术,专攻风险评估与投资分析,为投资经理提供决策支持。通过机器学习与自然语言处理技术,Aladdin能从海量市场资讯中提炼价值,包括新闻报道、社交媒体动态及企业财报,助力投资者洞察市场风云。Aladdin利用了一种系统性的投资方法,其中涉及如步态跟踪、信用卡刷卡、电子商务交易和驾驶时间等数据。所有这些数据都被输入到平台上,以识别消费者的消费模式和趋势,预测并相应地响应宏观经济环境中的潜在威胁。

Aladdin在2022年为Blackrock带来了14亿美元的技术收入,且三年复合年增长率高达12%。作为最初只是BlackRock内部的风险管理平台,随着结合AI Agent的功能,Alladin现已被1000多家组织用于部分或全部投资流程。可以说,目前的Alladin是BlackRock的核心,也是公司未来的愿景。

2、J.P. Morgan的LOXM系统

J.P. Morgan于2017年宣布了LOXM系统,一个AI程序,旨在基于数十亿次历史交易数据,为客户执行交易以实现最高效率和最优价格。LOXM提高了J.P. Morgan交易执行率,解决的客户交易需求,且在2017年Q1的实践运用中,在没有提高风险管理问题的情况下展现出了性能上的优势。

调查显示,交易员们通过使用LOXM,使订单执行效率提高了约15%。这种性能的提升意味着在高频交易竞争激烈的环境中,AI Agent迈出了通往主导地位的重大一步。

3、Two Sigma 量化投资

Two Sigma在交易中使用AI Agent的一个例子是其选股策略。该公司使用机器学习模型分析大量财务数据,以识别可能优于同行的公司。这些模型考虑了诸如盈利增长、现金流和估值比率等因素,以及利率和GDP增长等宏观经济数据。AI还帮助Two Sigma在其他资产类别中做出投资决策,如商品和货币。该公司使用NLP(自然语言处理算法)分析新闻文章和社交媒体帖子,以识别各种商品(如石油和黄金)周围的趋势和群众对商品的态度。同时,Two Sigma使用机器学习模型分析市场波动性、流动性和其他风险因素的数据,以识别对其投资组合的潜在风险。这使得他们能够调整其投资策略,以最小化风险并最大化回报。

4、RoboAgent

Meta和CMU 联合研究团队耗时两年,成功开发出的RoboAgent 通用机器人智能体。RoboAgent仅仅通过7500个轨迹的训练就实现了12种不同的复杂技能,包括烘焙、拾取物品、上茶、清洁厨房等任务,并能在100种未知场景中泛化应用。

无论遇到多大的干扰,RoboAgent 都能坚持完成任务。该研究的目标是建立一个高效的机器人学习范例,解决数据集和场景多样性的挑战。研究人员提出了多任务动作分块 Transformer(MT-ACT)架构,通过语义增强和高效的策略表示来处理多模态多任务机器人数据集。

5、Nvidia Voyager

由NVIDIA、加州理工学院等共同推出的Voyager,使用GPT-4来引导学习的Minecraft智能体通过像素世界,需要说明的是,Voyager依赖于代码生成,而不是强化学习。

Voyager是第一个玩《我的世界》的终身学习智能体。与其他使用经典强化学习技术的 Minecraft智能体不同,Voyager使用GPT-4来不断改进自己,通过编写、改进和传输存储在外部技能库中的代码来实现这一点。

这会产生一些小程序,帮助导航、开门、挖掘资源、制作镐头或与僵尸作战。GPT-4解锁了一种新的范式,在此范式中“训练”是代码的执行,“训练模型”是Voyager迭代组装的技能代码库。

6、Amazon Bedrock Agents

亚马逊发布的Amazon Bedrock Agents,允许开发人员快速创建完全托管的智能体。通过对企业系统执行API调用,Amazon Bedrock智能体加快了可管理和执行活动的生成式AI应用程序的发布速度。

Amazon Bedrock Agents简化了用户请求任务的快速工程和编排。设置完成后,这些智能体可以自主构建提示,并使用公司特定的数据安全地增强提示,从而向用户提供自然语言响应。这些高级智能体具有推断自动处理用户请求的必要操作的能力。

7、Inflection AI Pi

Inflection AI公司推出的个人AI Agent产品Pi,核心大脑是公司研发的Inflection-1大模型,性能媲美GPT-3.5。Pi与时下流行的通用聊天机器人不同,它只能进行友好的对话,提供简洁的建议,甚至只是倾听。

它的主要特征是富有同情心、谦虚好奇、幽默创新, 具有良好的情商,可以根据用户的独特兴趣和需求提供无限的知识与陪伴。Inflection自开发Pi开始,就确定了Pi将作为个人智能(Personal Intelligence),而不仅仅是辅助人工作的工具。

8、澜码科技Ask XBot

澜码科技构建的Agent平台“Ask XBot”,平台分两层:第一层是专家赋能,专家通过拖、拉、拽以及对话交互的方式定义工作流程,教给机器,从而协助一线员工构建更高效工作的方法论;第二层是员工使用Agent,一线员工可以通过自然语言和Agent沟通并下达指令,让Agent协助完成数据分析、资料调取等工作。

该公司计划将Ask XBo打造成一个兼具通用性和易用性的平台,把这些API和Agent做好管理,让Agent包装不同的API,不同模型的Agent能够在上面更好地协作,让它们可以在平台上更有效率、更智能地服务好客户。

9、OmBot欧姆智能体

2023 世界人工智能大会上,联汇科技发布了基于大模型能力的自主智能体(Auto AI Agent )——OmBot 欧姆智能体,并针对典型场景需求推出了首批应用。

联汇自主智能体包含了认知、记忆、思考、行动四大核心能力,作为一种自动、自主的智能体,它以最简单的形式中在循环中运行,每次迭代时,它们都会生成自我导向的指令和操作。因此,它不依赖人类来指导命令,具备高度可扩展性。

10、实在智能TARS-RPA-Agent

实在智能在超自动化领域首发的TARS-RPA-Agent,是一个基于“TARS+ISSUT(智能屏幕语义理解)”双模引擎、有“大脑”,更有“眼睛和手脚”的超自动化智能体,是能够自主拆解任务、感知当前环境、执行并且反馈、记忆历史经验的RPA全新模式产品。

TARS-RPA-Agent采用以TARS大模型和ISSUT智能屏幕语义理解为基座的技术框架。该技术框架分为两层结构:底层是包括通用基础模型和各个垂直行业基础模型在内的TARS系列大模型和智能屏幕语义理解技术;上层是依托这两项关键技术完成全面升级和改造的超自动化产品。

TARS-RPA-Agent的核心LLM是实在智能基于通用大模型基座的自研垂直“塔斯(TARS)”大模型,TARS大模型具备优异的文本生成、语言理解、知识问答、逻辑推理等主流能力。

ToB行业应用案例

1、彭博社BloombergGPT金融大模型

BloombergGPT是Bloomberg训练出来的金融大语言模型(LLM for Finance),彭博的机器学习产品和研究小组和人工智能工程团队合作,利用彭博在数据创建、收集和整理方面的资源,构建了迄今为止规模最大的专业领域数据集之一。

开发团队从这个由海量英文金融文档组成的档案库中提取并创建了一个包含3,630亿词例(token)的金融数据集。这批数据又与另一个包含3,450亿词例的公共数据集叠加,成为了包含超7,000亿词例的大型训练语料库。彭博的研究团队利用该语料库的一部分内容,训练了纯解码器(decoder-only)因果语言模型,包含500亿个参数。

  • 模型参数量为500亿,使用了包含3630亿token的金融领域数据集以及3450亿token的通用数据集
  • 隐藏层维度为7680,多头的头数为40
  • 模型采用Unigram tokenizer,AdamW优化器
  • 对BloombergGPT的评估包含了两部分:金融领域评估与通用领域评估
  • 评估对比的其他大语言模型有GPT-NeoX、OPT、BLOOM、GPT-3
  • 在金融领域任务上,BloombergGPT综合表现最好;在通用任务上,BloombergGPT的综合得分同样优于相同参数量级的其他模型,并且在某些任务上的得分要高于参数量更大的模型
  • BloombergGPT模型在金融领域取得好效果的同时,并没有以牺牲模型通用能力为代价
  • 对模型定性评估的结果表明,BloombergGPT可以提高工作效率
  • 出于安全性的考虑,BloogbergGPT模型不会被公开,但是模型训练和评估的相关经验和思考会被分享出来

2、马上消费金融 天镜大模型

马上消费金融天镜大模型在汇集智慧、唤醒知识、众创价值等几个方面比较突出:

  • 汇集智慧方面,主要是应用在人工客服场景,通过大模型提炼萃取一线优秀人工坐席客服经验,汇聚成群体智慧,从而拥有一对多服务客户的能力,也可作为人工坐席的辅助角色,帮助推荐、优化回答该模型已运行近3个月,意图理解准确率达91%,相较于传统AI的68%有较大提升;客户参与率61%,高于传统模型43%的参与率,也高于人工坐席平均28%的水平;
  • 唤醒沉睡知识,主要是高效解决了提取、利用非结构化文档中的数据资料的痛点。例如,将企业招股书、财报、经济预测数据等文件上传后,天镜大模型可以深入解析金融领域专业术语、同时查询定位多个不同文档、洞悉金融图表隐含的信息和强大归纳总结能力;
  • 众创数据价值,主要是为了降低使用数据的门槛。天镜大模型SQL生成平台不再需要代码等专业指令,可直接向AI 说大白话,天镜自动理解需求、展开检索、生成答复。当前,天镜每日线上SQL生成数量650多次,线上SQL生成可执行比例53.4%,SPIDER标准数据集EX得分75.2,线上使用者满意反馈比例82.3%,表现领先行业。

3、阿里巴巴城市大模型 CityGPT

2023 年 7 月 7 日,城市大模型 CityGPT 正式发布,旨在提升智能城市的治理能力,赋能城市经济、产业、商业、文旅、金融等领域,打造真正的城市级大脑。具体地,在认知人工智能领域首次开启了空间场景智能决策以及“元宇宙城市”可交互体验价值链,能够实现对城市-园区-商圈-社区-网点级别的智能计算与研判,为线上线下数实融合的智能决策和场景交互提供具有 AI 自学习能力的“空间 AI 专家顾问”服务。

4、DeepMind生物科技模型AlphaFold2

AlphaFold2通过深度学习和人工神经网络等技术,预测蛋白质的三维结构。在此之前,预测蛋白质结构是一项非常耗时、困难且复杂的任务,需要耗费许多时间和大量的实验数据。AlphaFold2 使得人们可以在数分钟内预测蛋白质的结构。

已知氨基酸顺序的蛋白质分子有1.8亿个,但三维结构信息被彻底看清的还不到0.1%。2021年8月,DeepMind公司在《自然》上宣布已将人类的98.5%的蛋白质预测了一遍,计划年底将预测数量增加到1.3亿个,达到人类已知蛋白质总数的一半,并且公开了AlphaFold 2的源代码,免费开源有关数据集,供全世界科研人员使用。

5、谷歌医疗大模型Med-PaLM,AI医生成绩比肩人类

由谷歌Research和DeepMind共同打造的多模态生成模型Med-PaLM M,懂临床语言、懂影像,也懂基因组学。

Med-PaLM 2 是首个在美国医疗执照考试(USMLE)的 MedMCQA 数据集上达到「专家」应试者水平表现的 LLM,准确率达到 85% 以上,也是首个在包括印度 AIIMS 和 NEET 医学考试问题的 MEDMCQA 数据集上达到及格分数的 AI 系统,得分为 72.3%。

在246份真实胸部X光片中,临床医生表示,在高达40.50%的病例中,Med-PaLM M生成的报告都要比专业放射科医生的更受采纳,这表明Med-PaLM M并非“纸上谈兵”,用于临床指日可待。

6、华为盘古气象大模型

华为云盘古气象大模型是首个精度超过传统数值预报方法的AI模型,能够提供秒级全球气象预报,原来预测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。而现在基于预训练的盘古大模型,通过AI推理的方式,只需1台服务器、1卡配置、10秒时间,就可以获得更精确的预测结果。盘古气象大模型的预测结果包括位势、湿度、风速、温度、海平面气压等,可以应用于台风路径预测、降水预测、寒潮和高温预测等多个气象研究细分场景。

开源人工智能应用案例

1、VMWare

VMWare 部署了 HuggingFace 的 StarCoder 模型,该模型可帮助开发人员生成代码,从而提高开发效率。VMWare 选择自行托管该模型,而不是使用像微软拥有的 Github 的 Copilot 这样的外部系统。

2、Gab Wireless

这家儿童友好型手机公司强调安全和保障,它使用 Hugging Face 公司提供的一套开源模型,为筛选儿童收发的信息添加了一个安全层。这样可以确保在与不认识的人进行互动时,不会出现不恰当的内容。

3、Perplexity

这家炙手可热的初创公司正在通过使用 LLM 来重塑搜索体验。该公司目前只有 50 名员工,但筹集到 7400 万美元。虽然它不符合我们对企业的定义,但它的有趣之处值得一提。当用户向 Perplexity 提出一个问题时,它的引擎会使用大约六个步骤来做出回答,在此过程中还会使用多个 LLM。Perplexity 的员工 Dmitry Shevelenko 说,倒数第二步默认使用自己定制的开源 LLM。这一步是总结 Perplexity 认为符合用户问题的文章或资料来源的材料。Perplexity 在 Mistral 和 Llama 模型的基础上建立模型,并使用 AWS Bedrock 进行微调。

Shevelenko 说,使用 Llama 至关重要,因为它有助于 Perplexity 掌握自己的命运。他说,在 OpenAI 模型上投资,对模型进行微调是不值得的,因为你并不拥有结果。值得注意的是,Perplexity 还同意为 Rabbit R1 提供动力,因此 Rabbit 也将通过 Perplexity 的 API 有效使用开源 LLM。

4、Intuit

Intuit 是 TurboTax、Quickbooks 和 Mailchimp 等软件的提供商,很早就开始构建自己的 LLM 模型,并在驱动其 Intuit Assist 功能的 LLM 混合中利用开源模型,该功能帮助用户处理诸如客户支持、分析和任务完成工作。在采访中,Intuit 的执行官 Ashok Srivastava 说,其内部 LLM 是基于开源构建并在 Intuit 自己的数据上进行训练的。

5、LyRise

这家人才匹配初创公司 LyRise 使用一个建立在 Llama 上的聊天机器人,像人类招聘人员一样互动,帮助企业从非洲各行业的高质量简历库中找到并雇佣顶尖的 AI 和数据人才。

6、Niantic

Pokemon Go 的创造者推出了一个名为 Peridot 的新功能,它使用 Llama 2 生成宠物角色在游戏中的环境特定反应和动画。

推荐阅读:
API掌舵者:为什么API产品经理掌握着关键?
一人AI创新项目为什么要加入API平台!重要吗?
为什么API经济在经济不确定时期表现突出
销售国内API,有没有合适的API平台?
零成本开发!试试这6个免费的API接口平台
程序员都应该了解的7款API接口平台
#你可能也喜欢这些API文章!