所有文章 > 当前标签:gpt
用了3小时从0训练小GPT!
用了3小时从0训练小GPT!
2025/03/13
MiniMind是一个开源项目,通过优化DeepSeek-V2和Llama3结构,使得个人电脑仅需2G显卡就能在3小时内训练出26M的小规模GPT模型。项目包含数据处理、预训练、微调等全部阶段,并支持混合专家(MoE)模型。MiniMind旨在降低大语言模型(LLM)的学习门槛,使每个人都能体验完整训练一个大模型的过程。项目还提供了在Ceval数据集上测试模型的代码,并实现了Openai-Api基本的chat接口,方便集成到第三方ChatUI使用。
LangChain + GPT :总结长文本
LangChain + GPT :总结长文本
【日积月累】 随着大语言模型的不断普及,我们已经可以经常使用各类模型对文本进行高质量的文本总结。然而,大部分大语言模型接口都会对输入文本的长度有所限制,这个限制通常被称为"上下文窗口(context window)"。当需要总结的文本长度超过这个窗口时,...
2025/02/28
一文彻底讲透GPT架构及推理原理
一文彻底讲透GPT架构及推理原理
【日积月累】 文章从开发人员的视角系统性总结了GPT架构及其推理原理,旨在帮助初学者深入理解大语言模型的工作机制。文章首先介绍了人工智能的发展历程,特别是自然语言处理(NLP)从统计语言模型到大语言模型的演变。接着,文章详细解析了Transformer架构的核心——自注意力机制,以及其在处理长距离依赖和并行计算上的优势。文章进一步探讨了GPT模型的架构设计,包括输入层、隐藏层和输出层的功能,以及多头注意力机制(MHA)、前馈神经网络(FFN)和KV缓存等关键技术。此外,文章还介绍了多查询注意力(MQA)和分组查询注意力(GQA)等优化技术,并讨论了输出层如何通过Softmax函数生成词元的概率分布。最后,文章强调了提示工程的重要性,并建议通过优化提示词来提升大模型的性能,同时推荐了相关的学习资源和实践方法。
2025/02/21
附带已安排任务的GPT-4:人工智能助手的新里程碑
附带已安排任务的GPT-4:人工智能助手的新里程碑
【日积月累】 从GPT-3到GPT-4,每一次迭代都带来了显著的进步和新的可能性。最近,OpenAI发布了GPT-4的一个新版本——附带已安排任务的GPT-4(GPT-4 with Task Scheduling),这一版本不仅在自然语言处理能力上有所提升,还引入了任务调度的功能,使得GPT-4能够更好地管理和执行复杂的任务。本文将围绕这一新特性,探讨其背后的技术原理、应用场景以及对未来人工智能发展的影响。
2025/02/06
Wise账号购买教程
Wise账号购买教程
【日积月累】 如何使用英国公司注册 Wise 企业账号的流程,帮助用户轻松获得美元、欧元等货币的银行账号。首先,注册英国公司后,准备好护照和境外信用卡或借记卡,用于支付 45 英镑的开户费用。注册过程中,选择英国作为注册国家,填写公司信息,并通过 Wise 的邀请链接注册可获得 ¥75,000 的免费汇款额度。注册时需提供英国公司的注册号,信息会自动填充。验证个人信息时,上传护照即可。最后,通过境外银行账户完成 45 英镑的付款验证,即可成功注册 Wise 企业账号。注册成功后,用户可以申请 Wise 的虚拟借记卡和实体借记卡,享受多种货币的银行账号服务。
2025/02/03
AI聊天机器人手册:如何使用Redis、Python和GPT构建AI聊天机器人
AI聊天机器人手册:如何使用Redis、Python和GPT构建AI聊天机器人
【如何集成API】 本教程将带您完成构建 AI 聊天机器人的过程,以帮助您深入了解这些概念。
2024/10/11
搜索、试用、集成国内外API!
幂简集成API平台已有 4606种API!
API大全
搜索文章