所有文章 > 当前分类:AI驱动
LLM推理部署(一):LLM七种推理服务框架总结
LLM推理部署(一):LLM七种推理服务框架总结
2024/12/06
自从ChatGPT发布以来,国内外的开源大模型如雨后春笋般成长,但是对于很多企业和个人从头训练预训练模型不太现实,即使微调开源大模型也捉襟见肘,那么直接部署这些开源大模型服务于企业业务将会有很大的前景,本文将介绍七中主流的LLM推理和服务开...
LLM微调系列:LORA(5)
LLM微调系列:LORA(5)
【AI驱动】 Lora LoRA,英文全称Low-Rank Adaptation of Large Language Models。 冻结预训练好的模型权重参数,然后在每个Transformer块里注入可训练的层,由于不需要对模型的权重参数重...
2024/12/06
LLM微调(三)| 大模型中RLHF + Reward Model + PPO技术解析
LLM微调(三)| 大模型中RLHF + Reward Model + PPO技术解析
【AI驱动】 本文将深入探讨RLHF(Reinforcement Learning with Human Feedback)、RM(reward model)和PPO(Proximal Policy Optimizer)算法的概念。然后,通过代码演示使用...
2024/12/06
LLM微调(二)| 微调LLAMA-2和其他开源LLM的两种简单方法
LLM微调(二)| 微调LLAMA-2和其他开源LLM的两种简单方法
【AI驱动】 本文将介绍两种开源工具来微调LLAMA-2。 一、使用autotrain-advanced微调LLAMA-2        AutoTrain是一种无代码工具,用于为自然语言处理(NLP)任务、计算机视觉(CV)任务、语音任务甚...
2024/12/06
扩散模型实战(二):扩散模型的发展
扩散模型实战(二):扩散模型的发展
【AI驱动】   扩散模型从最初的简单图像生成模型,逐步发展到替代原有的图像生成模型,直到如今开启 AI 作画的时代,发展速度可谓惊人。下面介绍一下2D图像生成相关的扩散模型的发展历程,具体如下: 开始扩散:基础扩散模型的提出与改进; 加速...
2024/12/06
扩散模型实战(一):基本原理介绍
扩散模型实战(一):基本原理介绍
【AI驱动】  扩散模型(Diffusion Model)是⼀类⼗分先进的基于物理热⼒学中的扩散思想的深度学习⽣成模型,主要包括前向扩散和反向扩散两个过程。⽣成模型除了扩散模型之外,还有出现较早的VAE(Variational Auto-Enc...
2024/12/06
LLM之Agent(十二)| OpenAI Agent-Swarm简单入门
LLM之Agent(十二)| OpenAI Agent-Swarm简单入门
【AI驱动】 参考文献: 项目地址: 本文简单介绍一下如何使用Swarm: 一、首先需要安装环境(python3.10+) # 创建python虚拟环境(可选) conda create -n python=3.10 ...
2024/12/06
LLM之Agent(十一)| 多智能体框架CrewAI与AutoGen相比
LLM之Agent(十一)| 多智能体框架CrewAI与AutoGen相比
【AI驱动】 基于LLM构建的Agent中有一个明显的现象就是多智能体体系结构的表现要超越单智能体,即使单智能体使用无可挑剔的提示策略。本文将探索另一个有趣的多智能体框架——CrewAI。 一、CrewAI整体优势        CrewAI...
2024/12/06
LLM之Agent(十)| 本地安装Microsoft AutoGen Studio 2.0教程
LLM之Agent(十)| 本地安装Microsoft AutoGen Studio 2.0教程
【AI驱动】   2021年3月,微软发布了AutoGen[2],这是一个使用多个代理开发LLM应用程序的框架,这些代理可以协作解决任务。      2024年1月,微软推出了一款新的应用程序,它名为AutoGen S...
2024/12/06
LLM之Agent(九)| 通过API集成赋能Autogen Multi-Agent系统
LLM之Agent(九)| 通过API集成赋能Autogen Multi-Agent系统
【AI驱动】 随着大型语言模型(LLM)的迅猛进步,开发由LLM驱动的自主智能体(autonomous agents)已经成为研究和实践的热点领域。在过去的一年里,涌现出许多基于这一概念的创新技术和平台。  但作为一个仍处于早期阶段的框架,通过AP...
2024/12/06
LLM之Agent(八)| 使用CrewAi、Solor/Hermes、Langchain和Ollama构建超级Agent
LLM之Agent(八)| 使用CrewAi、Solor/Hermes、Langchain和Ollama构建超级Agent
【AI驱动】   随着大模型技术的发展,AI Agent正在成为大模型游戏规则的改变者,它可以帮助用户分解任务、规划任务和执行任务,这就是CrewAI的独特之处。CrewAI是AutoGEN的顶级替代品,为您提供轻松组建人工智能Agent团队执行自动化任...
2024/12/06
API描述语言如何赋能AI
API描述语言如何赋能AI
【AI驱动】 人工智能驱动的 API 已经取得了长足的进步,尤其是当人工智能知道会发生什么时候。这就是API 描述语言对于 AI 的未来如此重要的原因之一,这要归功于代码脚手架等趋势。要了解有关这一新兴领域的更多信息,让我们深入研究 API 描述语言的进步如何推动人工智能的未来。
2024/12/04
LLM之Agent(七)| AutoGen介绍
LLM之Agent(七)| AutoGen介绍
【AI驱动】 一、Autogen介绍        Autogen是Microsoft开发的一个用于简化LLM工作流的编排、优化和自动化的框架。它提供了可定制和可交谈的代理,充分利用了大模型(比如GPT-4)的能力,并且可以集成人类智慧和工具,在多...
2024/12/04
LLM之Agent(六)| 使用AutoGen、LangChian、RAG以及函数调用构建超级对话系统
LLM之Agent(六)| 使用AutoGen、LangChian、RAG以及函数调用构建超级对话系统
【AI驱动】   本文我们将尝试AutoGen集成函数调用功能。函数调用最早出现在Open AI API中,它允许用户调用外部API来增强系统的整体功能和效率。例如,在对话过程中根据需要调用天气API。       函...
2024/12/04
LLM微调(一)| 单GPU使用QLoRA微调Llama 2.0实战
LLM微调(一)| 单GPU使用QLoRA微调Llama 2.0实战
【AI驱动】 最近LLaMA 2在LLaMA1 的基础上做了很多优化,比如上下文从2048扩展到4096,使用了Grouped-Query Attention(GQA)共享多头注意力的key 和value矩阵,具体可以参考: 使用QLoRA...
2024/12/04
LLM实战(二)| 使用ChatGPT API提取文本topic
LLM实战(二)| 使用ChatGPT API提取文本topic
【AI驱动】  在大模型前时代,构建机器学习模型通常需要标注数据,然后使用这些标注数据来训练机器学习模型,这个过程一般需要几个月的时间,然而,在大模型时代下,几个小时就可以完成,比如情感分类,对话系统。具体对比流程如下: Prom...
2024/12/04
1 44 45 46 47 48 64