所有文章 > 当前分类:AI驱动
Nacos 发布 MCP Registry,实现存量应用接口“0改动”升级到 MCP 协议
Nacos 发布 MCP Registry,实现存量应用接口“0改动”升级到 MCP 协议
2025/04/08
get weather
MCP 架构设计演进:从 Local MCP Server 到 Remote MCP Server 开源架构设计实现
MCP 架构设计演进:从 Local MCP Server 到 Remote MCP Server 开源架构设计实现
【AI驱动】 本文探讨了 Model Context Protocol(MCP)架构从 Local MCP Server 到 Remote MCP Server 的演进。Local MCP Server 虽简单易用,但在企业级应用中存在本地环境依赖、安全风险、一致性问题和维护成本高等局限性。Remote MCP Server 通过云端部署,解决了这些问题,具备集中化安全管控、统一权限管理和简化部署与维护等优势。阿里开源的 Higress 提供了 Remote MCP Server 的托管实现方案,支持多种接入方式,具备统一认证授权、流量控制、可观测性等功能,并通过 Wasm 插件扩展能力,有效屏蔽异构协议复杂性。
2025/04/07
64张图,看懂AI Agent的核心技术与未来
64张图,看懂AI Agent的核心技术与未来
【AI驱动】 本文通过64张图深入解析了LLM Agents的核心技术和未来发展趋势。文章首先介绍了LLM Agents与传统LLM的区别,强调了LLM Agents需要记忆、工具和规划等组件协同工作。接着探讨了LLM Agents的记忆机制,包括短期记忆和长期记忆,以及如何通过上下文窗口和外部数据库实现。文章还阐述了工具的使用,包括获取数据和执行操作,以及Toolformer和MCP等技术。在规划方面,讨论了推理、ReAct和Reflexion等技术,以及多Agent协作的框架和应用。最后,文章总结了LLM Agents的构建方式,并展望了其未来发展。
2025/03/21
大模型上下文协议与Spring开发集成篇——mcp-spring-webmvc原理
大模型上下文协议与Spring开发集成篇——mcp-spring-webmvc原理
【AI驱动】 Claude作为智能AI编程助手,能够基于产品需求进行代码生成和优化
2025/03/17
DeepSeek发布开源数学定理证明模型
DeepSeek发布开源数学定理证明模型
【AI驱动】 DeepSeek发布了开源数学定理证明模型Prover-V1.5,通过将数学问题转换为Lean编程语言,引入强化学习系统,实现了自我迭代和Lean证明器监督。该模型在高中和大学数学定理证明测试中取得了63.5%和25.3%的成功率,超越了多款开源模型。DeepSeek-Coder-V2结合Lean证明器标注中间状态信息,提高了模型的形式化证明能力。模型训练采用GRPO算法进行强化学习训练,并引入RMaxTS算法解决证明搜索中的奖励稀疏问题。DeepSeek-Prover-V1.5在miniF2F和ProofNet基准测试中取得了新的SOTA。
2025/03/17
从零开始教你打造一个MCP客户端
从零开始教你打造一个MCP客户端
【AI驱动】 本文介绍了如何从零开始打造一个MCP客户端。MCP协议由Anthropic开源,用于连接AI系统与数据源,提供通用开放标准,简化集成方式。文章详细讲解了MCP架构,包括MCP Hosts、Clients和Servers,并通过示例代码展示了如何实现一个简单的MCP Server。此外,还介绍了如何使用SDK和调试工具,以及在客户端中使用MCP Server。最后,文章指导如何实现MCP Client,包括配置文件、交互形态和编写Client代码,以便在自己的应用中支持MCP协议。
2025/03/14
一文讲透 AI Agent 与 AI Workflow 的区别和深度解析:从自动化到智能化的演进
一文讲透 AI Agent 与 AI Workflow 的区别和深度解析:从自动化到智能化的演进
【AI驱动】 本文深入探讨了AI Agent与AI Workflow的区别和联系。AI Agent是具有自主意识的智能实体,能够感知环境、推理决策并采取行动,强调自主学习和决策能力,适应性强,适合处理不确定性和需灵活调整的场景。AI Workflow则是一系列预定义、有序的任务步骤组成的智能化生产线,强调标准化、自动化和可预测性,适合处理结构化、重复性任务。两者各有优势,适用于不同场景,未来将不断融合进化,推动AI技术的发展。
2025/03/13
实测告诉你:DeepSeek-R1 7B、32B、671B差距有多大
实测告诉你:DeepSeek-R1 7B、32B、671B差距有多大
【AI驱动】 DeepSeek-R1系列模型性能差异显著,其中7B、32B与671B版本在语言能力、联网总结、逻辑推理和代码能力等方面存在巨大差距。7B版本在基础文字生成方面表现不佳,32B版本虽有提升但仍存在瑕疵,而671B版本表现出色。此外,本地部署DeepSeek-R1成本较高,对普通用户来说技术门槛较高,建议从32B版本起步。
2025/03/13
本地部署私人知识库的大模型!Llama 3 + RAG
本地部署私人知识库的大模型!Llama 3 + RAG
【AI驱动】 本教程介绍了如何利用Meta AI的Llama 3语言模型和检索增强生成(RAG)技术,本地部署一个个性化的大模型,实现与网页的交互式对话,检索私人知识库信息并生成准确响应。通过设置开发环境、加载网页数据、创建嵌入和向量存储、实现RAG链等步骤,最终构建并运行一个Streamlit应用程序,允许用户输入网页URL,应用程序加载处理网页数据,检索相关信息并生成响应。整个过程无需编码经验,通过No Code Builder即可创建AI应用程序。
2025/03/13
大模型的数学原理详解
大模型的数学原理详解
【AI驱动】 这篇文章详细介绍了大模型的数学原理,包括两个主要章节。第一章节讨论了子章节内容和相关列表,展示了Python代码示例。第二章节探讨了关键点,并提供了JavaScript代码示例。文章还包含图片和代码块,旨在帮助读者深入理解大模型的数学基础。转载来源:微信公众号文章。
2025/03/13
DeepSeek-V2.5:融合通用与代码能力的全新开源模型
DeepSeek-V2.5:融合通用与代码能力的全新开源模型
【AI驱动】 DeepSeek-V2.5是一个融合了通用对话和代码处理能力的全新开源模型,它保留了DeepSeek-V2-Chat的通用对话能力和DeepSeek-Coder-V2的代码处理能力,并优化了人类偏好对齐。在写作、指令跟随等方面有显著提升,现已在网页端和API全面上线,功能包括Function Calling、FIM补全和Json Output等。DeepSeek-V2.5在安全性和代码能力上也进行了优化,提升用户体验。
2025/03/13
6个大模型的核心技术介绍
6个大模型的核心技术介绍
【AI驱动】 本文介绍了大模型背后的六大核心技术:1. Transformer模型,采用自注意力机制,有效处理长序列问题,具备并行计算优势,在NLP领域有广泛应用。2. 预训练技术,通过大数据预训练提取语言特征,自监督学习提高模型理解和泛化能力。3. RLHF技术,结合强化学习和人类反馈优化模型行为。4. 模型压缩技术,通过权重裁剪、量化和知识蒸馏减小模型大小,降低计算资源需求。5. 多模态融合技术,结合不同模态数据增强模型感知和理解能力。6.
2025/03/13
太强了!各个行业的AI大模型!金融、教育、医疗、法律
太强了!各个行业的AI大模型!金融、教育、医疗、法律
【AI驱动】 本文介绍了多个行业AI大模型的最新进展,特别关注了金融、教育、医疗和法律领域。在医疗领域,涌现了如DoctorGLM、BenTsao等基于ChatGLM-6B等模型的中文医疗对话模型,通过前沿技术实现了微调和部署。同时,还提供了多个领域的AI模型评测基准,如C-Eval、AGIEval等,为行业模型的性能评估提供了参考。
2025/03/13
在Sealos 平台的帮助下一个人维护着 6000 个数据库
在Sealos 平台的帮助下一个人维护着 6000 个数据库
【AI驱动】 Sealos平台通过其强大的数据库管理能力,使个人能够轻松管理6000多个数据库实例。它解决了传统数据库管理中的复杂性,如资源分配、监控告警、权限管理等,并提供了自动化管理的核心特性,包括一键式部署、高可用架构、备份与恢复等。Sealos与KubeBlocks的结合,使得数据库管理变得简单高效,显著降低了运维成本和复杂度,适合从开发到生产的各类场景。
2025/03/13
通义万相,开源!
通义万相,开源!
【AI驱动】 通义万相Wan2.1是一款开源的视频生成模型,具备处理复杂运动、还原物理规律、提升影视质感、优化指令遵循等优势,能满足创作者、开发者和企业用户的高质量视频生成需求。它还支持中英文文字特效生成,适用于广告、短视频等。在VBench评测中以86.22%的总分领先。技术创新包括3D因果VAE、预训练策略、数据链路构建等,实现了视频隐空间压缩和高效编解码。训练策略采用6阶段分步训练法,数据处理关注数据清洗和质量筛选。优化策略涉及显存优化、训练稳定性和多卡扩展性,提升了整体效率。Wan2.1已在多个平台开源,支持主流框架和一键推理部署,降低了开发门槛。
2025/03/13
使用Cursor 和 Devbox 一键搞定开发环境
使用Cursor 和 Devbox 一键搞定开发环境
【AI驱动】 本文介绍了如何通过Cursor和Devbox轻松搭建开发环境。使用Sealos的Devbox功能,用户可以一键预配置开发环境并连接数据库,避免繁琐的环境设置。文中详细演示了如何创建数据库及开发环境,并通过Cursor编译器实现Go项目的初始化和数据库操作。Sealos数据库支持多种数据库管理系统,提供高效的管理工具,适合各种开发场景。这种集成化的开发体验,使得开发者能专注于产品实现而非环境配置。
2025/03/13