所有文章 > 当前标签:大语言模型
FastGPT知识库接口案例:构建本地化智能问答系统的深度解析
FastGPT知识库接口案例:构建本地化智能问答系统的深度解析
2025/01/16
本文将深入探讨如何利用FastGPT构建一个本地化的知识库接口系统,并结合实际案例,分析其技术优势、部署流程、知识库管理及自定义模型集成,为开发者提供专业且深度的指导。
大语言模型技术是什么?
大语言模型技术是什么?
【日积月累】 本文聚焦大语言模型技术 Large Language Model,简称LLM,详述其基于深度学习利用海量文本经预训练与微调掌握语言规律的原理,介绍 Transformer 架构及训练机制;梳理从萌芽至爆发增长各阶段历程;展现内容创作、客服、开发等多领域应用;剖析数据、可解释性、伦理等挑战;展望架构、效率、应用拓展及协同发展趋势,全面解读该技术现状与未来走向
2025/01/09
利用AI API增强您的应用程序
利用AI API增强您的应用程序
【学习各类API】 今天,我们将深入探讨如何在应用程序中使用AI,特别是如何利用LLM来构建应用程序。我们还将讨论在决定是构建自己的AI API还是使用第三方AI供应商API时需要考虑的关键因素。
2024/09/01
大模型Prompt技巧
大模型Prompt技巧
【AI驱动】 提示工程不仅仅是关于设计和研发提示词,还包含了与大语言模型交互和研发的各种技能和技术。提示工程在实现和大语言模型交互、对接,以及理解大语言模型能力方面都起着重要作用。
2024/08/19
如何利用微调LLMs预测股票收益率
如何利用微调LLMs预测股票收益率
【AI驱动】 本文探讨了微调大型语言模型(LLMs)以利用财务新闻流预测股票回报的方法,比较了编码器和解码器LLMs在不同文本表示方法下的性能,并发现聚合表示通常能提升投资组合表现,其中Mistral模型在多个投资宇宙中表现稳健,而基于LLMs的回报预测比传统情感分析更能增强投资组合构建的效果。
2024/08/19
大语音模型(LLM) 中的“参数”一词是什么意思?
大语音模型(LLM) 中的“参数”一词是什么意思?
【AI驱动】 当我们在大型语言模型 (LLM) 的上下文中谈论参数时,我们指的是帮助模型做出决策的内部配置。将参数视为决定模型如何运行的设置或规则。简单地说,它们就像您大脑中的神经元,帮助您思考、处理和决策。
2024/08/06
一文说尽大模型技术之一:LLM的架构
一文说尽大模型技术之一:LLM的架构
【AI驱动】 本文以“大语言模型技术”为核心,深入探讨了大语言模型(LLM)的关键技术细节。文章分为三个部分,分别介绍了LLM的架构、分布式预训练和参数高效微调技术。在架构部分,作者详细分析了GPT、LLaMA、ChatGLM和Falcon等模型的技术细节,包括分词器(tokenizer)、位置编码、层归一化、激活函数以及多查询注意力(Multi-query Attention)和分组查询注意力(Grouped-query Attention)等关键组件。这些技术细节对模型的训练速度和准确性有着直接影响。文章还探讨了并行Transformer模块的设计以及训练稳定性的重要性。整体而言,本文为读者提供了大语言模型技术的全面视角,适合对LLM技术感兴趣的研究者和开发者参考。
2024/07/22
AI大模型应用的6种架构设计模式,你知道几种?
AI大模型应用的6种架构设计模式,你知道几种?
【AI驱动】 根据多年的架构设计经验,作者在文中整理总结了一些针对大模型应用的设计方法和架构模式,试图应对和解决大模型应用实现中的一些挑战,比如:成本问题、延迟问题以及生成的幻觉等问题。
2024/06/27
大模型从原理到应用开发——提纲挈领,十问十答
大模型从原理到应用开发——提纲挈领,十问十答
【AI驱动】 本文是 新加坡科研局首席AI研究员黄佳 在CSDN直播间主题分享的文字版。
2024/06/12
一篇大模型Agent工具使用全面研究综述
一篇大模型Agent工具使用全面研究综述
【AI驱动】 本文对LLMs工具学习方面的现有工作进行全面调查。
2024/06/06
AI Agent框架 – 7大认知框架全解析与代码讲解ai实现
AI Agent框架 – 7大认知框架全解析与代码讲解ai实现
【AI驱动】 AI・AI Agent・代码讲解ai・AI Agent架构・AI大模型 生成式AI和AI Agent将彻底改变我们工作的方式,本文全面解析7大Agent认知框架的设计理解和实现方式。         
2024/06/06
企业如何快速建立自己的专属AI大模型?
企业如何快速建立自己的专属AI大模型?
【AI驱动】 本文将探讨企业如何快速建立自己的专属AI大模型。随着数字化时代的到来,大规模数据处理和智能决策成为企业发展的关键。文章将从选取合适的AI技术平台、优化数据集准备、有效训练大模型、部署和优化模型运行等方面,为读者提供建立专属AI大模型的全面指南。
2024/05/04
微软API系列:AI搜索、大语言
微软API系列:AI搜索、大语言
【学习各类API】 微软云服务类API是当今开发者不可或缺的必备工具之一。这些API基于微软领先的云平台和先进的技术,提供了广泛的功能和服务,涵盖了人工智能、大数据、物联网等多个领域。
2024/04/24
为什么 API 管理对于保护大语言模型的访问至关重要
为什么 API 管理对于保护大语言模型的访问至关重要
【日积月累】 支持生成式人工智能输出的大语言模型需要访问数据。与敏感公司数据相关的大语言模型会带来额外的安全风险,但可以通过使用 API 和 API 管理来降低这些风险。
2024/04/09
探索大语言模型资源:API融合与应用实践
探索大语言模型资源:API融合与应用实践
【学习各类API】 本文介绍了大型语言模型(LLMs)的核心技术、工作原理以及如何通过API实现人机高效对话。LLMs通过分析大量文本数据学习语言模式,生成连贯准确的文本响应。文章回顾了LLMs的发展历史,从早期的n-gram模型到神经网络技术的应用,再到Transformer模型的提出和BERT、GPT系列模型的里程碑。LLMs的训练分为预训练和微调两个阶段,需要大量数据和计算资源。文章还探讨了LLMs在多模态应用、专业化模型开发、资源优化和合理分配等方面的现状和挑战。最后,文章讨论了LLMs在API调用上的智能化体现,以及其在未来技术发展中的潜力和常见问题。在讨论大模型资源时,文章提到了多个来源,包括CSDN博客上关于AI领域常用大模型地址及下载方法的汇总,以及HyperAI超神经提供的30个优质NLP数据集和模型资源。这些资源对于开发者挑选和下载适配开发需求的模型与数据集至关重要,进一步推动了上层应用的拓展。
2024/01/25