所有文章 > 当前标签:RAG
Qwen3-Max-Preview 技术实战指南:超大模型 API 使用与多场景应用
Qwen3-Max-Preview 技术实战指南:超大模型 API 使用与多场景应用
2025/09/12
深入解析 Qwen3-Max-Preview 超大模型 API 的使用方法与最佳实践,涵盖多场景应用、检索增强生成(RAG)、工具调用及性能优化,帮助开发者高效部署大型 AI 模型。
ADP 面试 RAG 相似题 API:2 天推荐优化
ADP 面试 RAG 相似题 API:2 天推荐优化
【AI驱动】 📌 引言 在 2025 年的 AI 招聘赛道里,“48 小时内把相似题推荐准确率提升 10%” 听起来像 KPI 天方夜谭,却真实发生在 ADP 的面试系统里。 本文用一线实战笔记,带你拆解如何用 RAG(Retrieval-Augment...
2025/08/28
ADP IT 课程 RAG 问答 API:2 天低延迟实现
ADP IT 课程 RAG 问答 API:2 天低延迟实现
【AI驱动】 📌 引言 在企业培训场景里,学员的提问往往千变万化: “这门课的实验环境怎么登陆?” “Lab3 的评分细则是什么?” 传统 FAQ 页面更新慢、命中率低;而通用大模型又容易“幻觉”出本不存在的课程章节。 RAG(Retri...
2025/08/28
DeepSeek-V3.1 助力:副业撮合平台 3 天极速上线 AI 客服实战
DeepSeek-V3.1 助力:副业撮合平台 3 天极速上线 AI 客服实战
【AI驱动】 在当今快节奏的互联网时代,“天下武功,唯快不破” 这一法则在创业领域体现得淋漓尽致。尤其是对于“副业撮合平台”这类旨在连接自由职业者与需求方的初创项目,快速验证市场(MVP)、抢占早期用户心智至关重要。然而,一个巨大的矛盾摆在面前:平台上线...
2025/08/24
AI 推理(Reasoning AI)与智能客服融合:打造高可用个性化客服平台实战指南
AI 推理(Reasoning AI)与智能客服融合:打造高可用个性化客服平台实战指南
【AI驱动】 在AI 推理(Reasoning AI)和智能客服快速演进的时代,结合RAG(Retriever‑Augmented Generation)、向量检索、动作调用与多轮推理技术,已成为构建高可用个性化客服平台的核心路径。本文深度剖析AI Ag...
2025/07/17
18种最佳 RAG 技术
18种最佳 RAG 技术
【学习各类API】 文章详细剖析了包括简单 RAG、语义切分、上下文增强检索等在内的 18 种 RAG 技术,分析了它们的核心理念、优缺点。实验表明,Adaptive RAG 通过动态调整策略,在检索精度、响应效率等方面表现出色,成为最优选择。
2025/07/11
基于 Spring AI Alibaba 的 RAG 架构调优实践
基于 Spring AI Alibaba 的 RAG 架构调优实践
【AI驱动】 RAG(Retrieval Augmented Generation,检索增强生成)是一种结合数据工程、信息抽取和文本生成的技术范式,Spring AI Alibaba 是阿里巴巴开源的 AI 应用开发框架,基于 Spring AI 构建并提供了更高层面的抽象,帮助开发者快速构建 AI 应用。RAG 的四大核心步骤包括文档切割与智能档案库的建立、向量编码与语义地图的构建、相似检索与智能资料猎人应答触发流程、生成增强与专业报告撰写应答。
2025/05/26
RAG 2.0 深入解读
RAG 2.0 深入解读
【AI驱动】 RAG 2.0技术在多模态支持、复杂推理、检索质量等方面取得突破,但仍面临诸多挑战,如多模态数据处理不足、检索精度低、生成幻觉、计算资源消耗大等。其关键技术包括混合搜索、DPR、重排序模型、多模态RAG、强化学习和图神经网络等。RAG从1.0到2.0的架构升级显著提升了性能,未来Agentic RAG等方向将推动其进一步发展。
2025/05/07
如何用Ragas评估RAG系统:从理论到实践的深度指南
如何用Ragas评估RAG系统:从理论到实践的深度指南
【日积月累】 RAGAS为评估RAG系统提供了一个结构化的方法框架,通过从检索质量、生成质量、知识一致性、效率和鲁棒性等多个维度进行分析,帮助开发者更深入地理解和优化其系统。在实际应用中,合理选择指标并结合具体场景需求,可以最大化地发挥RAGAS的价值。
2025/03/27
本地部署私人知识库的大模型!Llama 3 + RAG
本地部署私人知识库的大模型!Llama 3 + RAG
【AI驱动】 本教程介绍了如何利用Meta AI的Llama 3语言模型和检索增强生成(RAG)技术,本地部署一个个性化的大模型,实现与网页的交互式对话,检索私人知识库信息并生成准确响应。通过设置开发环境、加载网页数据、创建嵌入和向量存储、实现RAG链等步骤,最终构建并运行一个Streamlit应用程序,允许用户输入网页URL,应用程序加载处理网页数据,检索相关信息并生成响应。整个过程无需编码经验,通过No Code Builder即可创建AI应用程序。
2025/03/13
基于Ollama与AnythingLLM的DeepSeek-R1本地RAG应用实践
基于Ollama与AnythingLLM的DeepSeek-R1本地RAG应用实践
【AI驱动】 基于Ollama和AnythingLLM的DeepSeek-R1本地RAG应用实践。使用Ollama框架部署DeepSeek-R1推理模型,实现智能告警处理,自动识别告警信息并生成处置建议。借助AnythingLLM搭建RAG系统,结合检索增强生成技术,提升回答精准度。方案支持私有化部署,降低AI应用开发门槛,展现AI技术落地价值。
2025/03/12
从0到1搭建本地RAG问答系统:Langchain+Ollama+RSSHub技术全解析
从0到1搭建本地RAG问答系统:Langchain+Ollama+RSSHub技术全解析
【AI驱动】 本文介绍了如何利用Langchain和Ollama技术栈在本地部署资讯问答机器人,并结合RSSHub处理资讯。强调数据质量和大模型性能对RAG系统上限的影响,指出RAG虽能缓解大模型幻觉和信息滞后,但无法完全消除。本文为本地搭建RAG系统的用户提供实用参考。
2025/02/28
基于DeepSeek的RAG系统:构建下一代智能问答系统
基于DeepSeek的RAG系统:构建下一代智能问答系统
【日积月累】 传统的问答系统通常依赖于预定义的规则或基于检索的方法,这些方法在处理复杂问题时往往表现不佳。近年来,结合检索增强生成(Retrieval-Augmented Generation, RAG)技术的问答系统逐渐成为研究热点。RAG系统通过结合检索和生成模型,能够从大规模知识库中检索相关信息,并生成高质量的答案。本文将详细介绍如何利用DeepSeek框架构建一个高效的RAG系统,并探讨其在实际应用中的优势与挑战。
2025/02/06
RAG是什么以及如何在LangChain中实现
RAG是什么以及如何在LangChain中实现
【日积月累】 RAG是什么:RAG,即检索增强生成,是一种结合检索技术与生成模型的方法,旨在增强大语言模型(LLM)的能力。通过引入外部知识源,RAG弥合LLM的常识与上下文之间的差距,从而提高生成答案的准确性,减少误导性信息。RAG的灵活性使其能够快速适应信息变化,降低计算成本,尤其适合处理实时更新的信息。在实践中,RAG可以结合LangChain、OpenAI和Weaviate等工具,构建高效的生成流程。
2025/02/05
RAG是什么:从理论到LangChain实践
RAG是什么:从理论到LangChain实践
【日积月累】 Claude作为智能AI编程助手,能够基于产品需求进行代码生成和优化。RAG是什么:检索增强生成(RAG)是一种创新技术,通过结合生成模型和检索模块,为大语言模型(LLM)提供额外的外部知识支持。这提高了生成模型的精确性和上下文相关性,减少了误导性信息。在RAG流程中,用户查询经过向量数据库检索、增强和生成步骤,最终产生更为精确的答案。本文详细介绍了RAG的理论背景、实现方法及在LangChain中的应用。
2025/02/05
自动化RAG项目评估测试:TruLens的应用与实践
自动化RAG项目评估测试:TruLens的应用与实践
【日积月累】 自动化RAG项目评估测试中,TruLens是一种有效工具,用于评估和优化大语言模型(LLM)在知识问答应用中的性能和质量。TruLens通过反馈函数评估LLM的输入、输出和中间结果,提供四种主要评估方式:知识评估、回答相关性、知识召回相关性和回答准确性。通过这些评估,TruLens能够识别模型的强项和需要改进的区域,为LLM应用提供系统化的质量保障。未来,TruLens的发展将进一步推动人工智能技术的应用。
2025/02/02