所有文章 > 当前标签:DeepSeek大模型

利用DeepSeek大模型在个人电脑上搭建个人知识库
2025/03/08
利用DeepSeek大模型在个人电脑上构建一个轻量、极速且免费的个人知识库。该知识库软件不需要向量数据库,对电脑性能要求低,能够快速响应查询并提供AI分析。作者选择了whoosh作为查询工具,因为它轻量且开源,同时选择了DeepSeek-r1:1.5b模型,因为它能够提供快速且高质量的回答。通过whoosh和DeepSeek-r1:1.5b的结合,实现了毫秒级的关键词查询和秒级的AI回复。此外,作者还对软件进行了多项改进,包括优化whoosh查询逻辑、调整PDF读取方案等,并计划增加更多功能,如网页抓取和自动大模型分析。目前,该软件已完全开源,用户可以通过作者的公众号获取代码。文章还提到了DeepSeek-r1模型的创新点,包括冷启动数据与多阶段训练、强化学习驱动的推理优化以及蒸馏技术扩展能力。作者强调,这个本地搭建的个人知识库方案是轻量高效的,极速响应的,并且完全免费开源,适合个人和企业使用。

DeepSeek V3 API Key 密钥使用指南:从入门到实践
【日积月累】
DeepSeek V3 是一款高性能的开源语言模型,它不仅具备强大的语言生成能力,还通过优化大幅降低了计算成本。本文将详细介绍如何使用 DeepSeek V3 的 API Key,帮助开发者快速上手并实现实际应用。
2025/02/05

深度求索(DeepSeek)的成本革命:中国大模型产业的技术突围与范式创新
【AI驱动】
一家名为深度求索(DeepSeek)的中国科技公司以令人惊叹的"成本控制力"引发行业震动。其最新公布的MoE架构大模型DeepSeek-V2,不仅以"推理成本降低99%"的突破性数据刷新行业认知,更在同等性能下实现训练成本仅为行业标杆的十分之一
2025/02/05

探索AI编程前沿:DeepSeek、CodeLlama、GLM与ChatGPT系列大模型Java编码能力测评
【AI驱动】
一、前言 去年8月份Meta开源Code Llama 7B/13B/34B系列时,做过一个关于Code Llama和ChatGPT的Java编码能力测评。当时Code Llama使用的是34B Instruct版本,ChatGPT使用...
2024/11/22