DeepSeek大模型(标签)文章,第1页-API学院-幂简集成

我是服务商

产品和服务

控制台

所有文章 > 当前标签:DeepSeek大模型

利用DeepSeek大模型在个人电脑上搭建个人知识库

利用DeepSeek大模型在个人电脑上搭建个人知识库

利用DeepSeek大模型在个人电脑上构建一个轻量、极速且免费的个人知识库。该知识库软件不需要向量数据库，对电脑性能要求低，能够快速响应查询并提供AI分析。作者选择了whoosh作为查询工具，因为它轻量且开源，同时选择了DeepSeek-r1:1.5b模型，因为它能够提供快速且高质量的回答。通过whoosh和DeepSeek-r1:1.5b的结合，实现了毫秒级的关键词查询和秒级的AI回复。此外，作者还对软件进行了多项改进，包括优化whoosh查询逻辑、调整PDF读取方案等，并计划增加更多功能，如网页抓取和自动大模型分析。目前，该软件已完全开源，用户可以通过作者的公众号获取代码。文章还提到了DeepSeek-r1模型的创新点，包括冷启动数据与多阶段训练、强化学习驱动的推理优化以及蒸馏技术扩展能力。作者强调，这个本地搭建的个人知识库方案是轻量高效的，极速响应的，并且完全免费开源，适合个人和企业使用。

DeepSeek V3 API Key 密钥使用指南：从入门到实践

DeepSeek V3 API Key 密钥使用指南：从入门到实践

【日积月累】 DeepSeek V3 是一款高性能的开源语言模型，它不仅具备强大的语言生成能力，还通过优化大幅降低了计算成本。本文将详细介绍如何使用 DeepSeek V3 的 API Key，帮助开发者快速上手并实现实际应用。

深度求索（DeepSeek）的成本革命：中国大模型产业的技术突围与范式创新

深度求索（DeepSeek）的成本革命：中国大模型产业的技术突围与范式创新

【AI驱动】一家名为深度求索（DeepSeek）的中国科技公司以令人惊叹的"成本控制力"引发行业震动。其最新公布的MoE架构大模型DeepSeek-V2，不仅以"推理成本降低99%"的突破性数据刷新行业认知，更在同等性能下实现训练成本仅为行业标杆的十分之一

探索AI编程前沿：DeepSeek、CodeLlama、GLM与ChatGPT系列大模型Java编码能力测评

探索AI编程前沿：DeepSeek、CodeLlama、GLM与ChatGPT系列大模型Java编码能力测评

【AI驱动】一、前言去年8月份Meta开源Code Llama 7B/13B/34B系列时，做过一个关于Code Llama和ChatGPT的Java编码能力测评。当时Code Llama使用的是34B Instruct版本，ChatGPT使用...

搜索、试用、集成国内外API！

幂简集成API平台已有 4764种API!

搜索文章