大语言模型架构全景图:趋势、基准与挑战
大语言模型架构全景图:趋势、基准与挑战
2025/02/28
前言 2017年,Transformer架构的问世,为自然语言处理(NLP)技术带来了颠覆性的变革。一种名为大语言模型(LLM)的深度学习模型应运而生,它们在理解自然语言和生成连贯回应方面展现出超凡的能力。LLM的复杂性远超传统神经网...
基于 InternLM 和LangChain搭建你的知识库
基于 InternLM 和LangChain搭建你的知识库
【日积月累】 InternStudio (OpenAIDE)[1] 是面向算法开发者与研究员的云端集成开发环境。基于「容器实例」,「镜像中心」,「分布式训练」,「公开数据集」模块为用户提供 “算力、算法、数据” 深度学习模型训练三要素,让算法开发变得更简...
2025/02/28
EmbedChain:比LangChain更加轻量化的LLM框架
EmbedChain:比LangChain更加轻量化的LLM框架
【日积月累】 一、前言 在之前的文章中,我们研究了如何使用LangChain结合大型语言模型(LLM)API来构建用户友好且直观的聊天机器人。现在,我们将探索一个新的Python包来进一步简化LangChain的实现。只需3-4行代码,我们就可以轻...
2025/02/28
LangChain + GPT :总结长文本
LangChain + GPT :总结长文本
【日积月累】 随着大语言模型的不断普及,我们已经可以经常使用各类模型对文本进行高质量的文本总结。然而,大部分大语言模型接口都会对输入文本的长度有所限制,这个限制通常被称为"上下文窗口(context window)"。当需要总结的文本长度超过这个窗口时,...
2025/02/28
LLM大语言模型+RAG实战+Langchain+ChatGLM-4+Transformer
LLM大语言模型+RAG实战+Langchain+ChatGLM-4+Transformer
【日积月累】 Langchain的定义 Langchain的组成 三个核心组件实现 整个核心组成部分 为什么要使用Langchain Langchain的底层原理 Langchain实战操作 LangSmith ...
2025/02/28
Java开发者LLM实战——使用LangChain4j构建本地RAG系统
Java开发者LLM实战——使用LangChain4j构建本地RAG系统
【日积月累】 01 引言    理解,首先 MCube 会依据模板缓存状态判断是否需要网络获取最新模板,当获取到模板后进行模板加载,加载阶段会将产物转换为视图树的结构,转换完成后将通过表达式引擎解析表达式并取得正确的值,通...
2025/02/28
LangChain 的问题所在
LangChain 的问题所在
【日积月累】 如果你在过去几个月里一直关注人工智能的爆炸式炒作,你可能已经听说过 LangChain。由 Harrison Chase 开发的 LangChain 是一个用于与 OpenAI 的 GPT API(后来扩展到更多模型)进行人工智能文本生成交...
2025/02/28
AIAgent如何实现?6张4090 魔改Llama2:一句指令拆分任务、调用函数
AIAgent如何实现?6张4090 魔改Llama2:一句指令拆分任务、调用函数
【日积月累】 AI Agent 是时下热门的一个方向,在 OpenAI 应用研究主管 LilianWeng 写的万字长文中[1],她提出 Agent = LLM+ 记忆 + 规划技能 + 工具使用。 简单来说,Agent 就是借助 LLM ...
2025/02/28
从0到1搭建本地RAG问答系统:Langchain+Ollama+RSSHub技术全解析
从0到1搭建本地RAG问答系统:Langchain+Ollama+RSSHub技术全解析
【AI驱动】 本文介绍了如何利用Langchain和Ollama技术栈在本地部署资讯问答机器人,并结合RSSHub处理资讯。强调数据质量和大模型性能对RAG系统上限的影响,指出RAG虽能缓解大模型幻觉和信息滞后,但无法完全消除。本文为本地搭建RAG系统的用户提供实用参考。
2025/02/28
激荡二十年:HTTPAPI的变迁
激荡二十年:HTTPAPI的变迁
【AI驱动】 2005年之前:API 的狂野西部 早期的互联网是非常狂野的,没有所谓前端后端之分。PHP 开发者可以把从处理用户的 HTTP 请求,连接 mysql,组装 SQL 进行查询,将查询结果转换成 HTML,一路到 HTML 响应返回给用...
2025/02/27
2025年AIAgent开发框架怎么选?
2025年AIAgent开发框架怎么选?
【AI驱动】 AI Agent,也叫智能体,正处于一个快速发展阶段。随着多个新框架的出现和该领域的新投资,现代人工智能代理正在克服不稳定的起源,迅速取代 RAG 成为实施重点。那么,2024 年最终会成为自主人工智能系统接管我们写电子邮件、预订航班、处理...
2025/02/27
AIAgent框架——MetaGPT技术详解
AIAgent框架——MetaGPT技术详解
【AI驱动】 MetaGPT简介简介 近年,大语言模型以其强大的自然语言处理能力,成为AI领域的一大热点。它们不仅能生成和理解文本,还能进行复杂的分析和推理。与此同时,大语言模型还带火了智能体(即AI Agent)。智能体是一种能够感知环境、进行决...
2025/02/27
2025年值得入坑AIAgent的五大框架
2025年值得入坑AIAgent的五大框架
【AI驱动】 Agent 目前我见到的最多的翻译是“智能体”,但是直译是“代理”。 那 Agentic 又要翻译成什么呢?我感觉“代理型”这样的词更合适。 所以为了不让读者混淆,我在本文直接用英文表示。 随着 LLM 的发展,AI 的能...
2025/02/27
本地部署资讯问答机器人:Langchain+Ollama+RSSHub实现RAG
本地部署资讯问答机器人:Langchain+Ollama+RSSHub实现RAG
【AI驱动】 经过调研,我决定先采取 Langchain+Ollama 的技术栈来作为 demo 实现,当然,后续我也会考虑使用 dify、fastgpt 等更加直观易用的 AI 开发平台。 整体框架设计思路如下: ...
2025/02/27
深度学习中的正则化
深度学习中的正则化
【日积月累】 本文探讨了深度学习中的正则化技术。这些技术旨在通过限制模型的复杂度来防止过拟合,从而提高模型的泛化能力。正则化方法包括L1和L2正则化、噪声注入、多任务学习、提前终止、稀疏表示、Dropout等。通过这些方法,深度学习模型能够更好地处理大规模数据集,并提高在未知数据上的性能。
2025/02/27
如何用AI进行预测分析
如何用AI进行预测分析
【日积月累】 AI技术在数据分析和预测领域展现了巨大的潜力,能够处理海量数据并提高决策的准确性。通过机器学习、数据挖掘、自然语言处理、图像分析等多种技术,AI实现了从数据中提取模式、进行智能预测并辅助决策的功能。然而,AI预测分析也面临数据质量、算法选择等挑战。本文将深入探讨如何有效应用AI进行预测分析。
2025/02/27
1 44 45 46 47 48 432