所有文章
> 当前分类:AI驱动

DeepSeek 第四天开源的模型设计套件
2025/03/08
DeepSeek在第四天开源了一套专为大规模AI模型设计的并行计算策略优化工具,包括DualPipe、EPLB和Profile-data三个项目。DualPipe是一种双向流水线并行算法,实现了前向和后向计算过程的计算-通信阶段完全重叠,减少了流水线气泡。EPLB是专家并行负载均衡器,通过复制工作量大的专家并合理分配到各GPU上,确保负载均衡。Profile-data提供了性能分析数据集,帮助社区理解计算与通信重叠的性能。这些工具共同支撑了DeepSeek-V3模型的高效训练和推理并行处理能力。

DeepSeek 第三天开源的 DeepGEMM
【AI驱动】
在DeepSeek开源周的第三天,团队发布了DeepGEMM,这是一个专为Hopper架构GPU优化的矩阵乘法库。DeepGEMM支持标准矩阵计算和混合专家模型(MoE)计算,为DeepSeek-V3/R1的训练和推理提供支持,并在Hopper GPU上实现了1350+ FP8 TFLOPS的高性能。该库的核心代码简洁高效,仅约300行,且在大多数矩阵尺寸下性能优于现有解决方案。DeepGEMM支持三种数据排列方式,包括标准排列和两种专为混合专家模型设计的特殊排列(连续排列和掩码排列),并采用即时编译技术,无需在安装时进行编译。
2025/03/08

如何在本地运行 DeepSeek
【AI驱动】
DeepSeek-R1作为一款开源的AI模型,因其出色的性能和成本效益而受到广泛关注。它不仅在问题解决、推理和编码方面表现出色,还通过内置的链式思考推理提升了效率。本文详细介绍了如何使用Ollama在本地免费运行DeepSeek-R1模型,整个过程仅需3分钟。通过简单的安装步骤,用户可以快速下载并启动该模型,实现在本地与DeepSeek-R1的交互。此外,文章还提供了如何结合SingleStore数据库和LangChain框架构建RAG应用的教程。通过NVIDIA NIM微服务获取DeepSeek-R1的API密钥后,用户可以利用LangChain将模型与SingleStore数据库连接,实现对自定义文档的查询和分析。这一过程不仅展示了DeepSeek-R1的强大功能,还为开发者提供了在本地运行和部署AI模型的实用指南。
2025/03/07

DeepSeek引发比特币下跌:市场波动背后的真相
【AI驱动】
近期,比特币市场经历了一轮显著波动,其价格在短时间内大幅下跌。尽管中国初创公司 DeepSeek 并未直接涉及比特币领域,但其引发的市场连锁反应却对比特币价格产生了显著影响。DeepSeek 提出的低成本人工智能模型引发了科技股的抛售潮,进而影响了比特币市场。比特币价格的下跌并非孤立事件,而是与科技股市场的整体表现密切相关。数据显示,比特币与纳斯达克指数的相关性在近期达到了0.5,显示出两者之间强烈的联动性。此外,比特币挖矿行业也受到了波及,相关公司股价出现了大幅下跌。尽管如此,市场对比特币的长期前景仍保持乐观,其价格走势将继续受到市场情绪和宏观经济环境的影响。投资者在面对短期波动时应保持谨慎,同时关注市场动态和政策变化。
2025/03/07

全网都在要Manus AI邀请码,可能是 DeepSeek 后最大惊喜
【AI驱动】
Manus AI 由Monica开发,是一款能够自主完成复杂任务的通用AI代理工具,例如筛选简历、房产分析和股票研究等。它强调简单易用和高质量成果,用户只需输入简单指令即可获得输出,其官网展示的应用实例也凸显了其解决现实问题的潜力。感谢您的指正,我会确保后续回答更加准确。
2025/03/07

一文搞懂什么是Manus,附实战案例
【AI驱动】
Manus 是一款由中国Monica.im团队于2025年3月5日发布的全球首款通用型AI智能体产品,其开发团队成立于2023年,专注于人工智能助手的开发。其核心定位是能够自主规划并执行复杂任务,直接交付完整成果,而不仅仅是提供建议或答案。
2025/03/07

通用AI智能体Manus详情介绍
【AI驱动】
通用AI智能体Manus是一种融合自然语言处理、多模态学习和强化学习的新型人工智能技术,其核心优势在于跨领域的智能化交互能力。在游戏领域,Manus通过动态调整NPC行为提升玩家体验;在金融科技中,它通过实时数据分析提供个性化投资建议。此外,Manus在模型轻量化、隐私保护等热点技术上也取得了显著进展。未来,随着技术优化与新场景探索的深入,通用AI智能体Manus有望成为人工智能发展的重要推动力量。
2025/03/06

DeepSeek R1 简单指南:架构、训练、本地部署和硬件要求
【AI驱动】
DeepSeek R1 是一种大型语言模型(LLM),通过强化学习(RL)显著提升了推理能力。与传统模型不同,它主要依赖强化学习而非监督学习,通过小组相对策略优化(GRPO)提高准确性和格式奖励,从而增强推理能力。
2025/03/06

Claude 3.7使用:全面指南与技术解析
【AI驱动】
Claude 3.7 Sonnet作为Anthropic公司最新发布的人工智能模型,凭借其混合推理能力和卓越性能,成为当前AI领域的焦点。本文详细介绍了Claude 3.7的使用方法,包括官方渠道和第三方平台,如Claude官网、Slack集成、Poe平台、ChatShare、Trae、Sider、Lmsys和Perplexity等。同时,针对国内用户,提供了通过AWS的Claude API、借助海外资源直接使用以及使用AI聚合站等策略。技术特点方面,Claude 3.7具备混合推理能力、强大的编码性能和灵活的输出容量,适用于多种实际应用场景,如医疗保健、金融服务和开发与编程。通过性能对比数据和示例代码,本文为用户提供了全面的技术解析和使用指南,帮助用户更好地理解和应用Claude 3.7 Sonnet。
2025/03/04

Wan2.1:开源AI视频模型的崛起,超越Sora的视频生成技术
【AI驱动】
Wan2.1 是由阿里巴巴云开发的一款开源AI模型,专为高效、高质量的视频生成而设计。它在多个方面表现出色,包括文本到视频(T2V)、图像到视频(I2V)、视频编辑和文本到图像(T2I)等功能,并且能够生成中英文双语字幕,使其在多语言应用场景中具有独特优势。Wan2.1 基于扩散变换器范式构建,通过流匹配框架增强,其核心创新包括 Wan-VAE 和 Video Diffusion DiT,能够高效处理1080P视频并保持时间连贯性。在 VBench 基准测试中,Wan2.1 的总体得分为86.22%,超越了竞争对手 Sora 的84.28%。它在 ID 一致性、单对象准确性和空间位置准确性方面表现出色,尽管在运动平滑性和大运动生成方面略逊一筹,但差距非常小。Wan2.1 的开源特性使其对开发者极为友好,开发者可以轻松获取其代码并进行定制和集成。其应用场景广泛,涵盖内容创作、教育、影视、广告、游戏等多个领域,能够为不同行业提供强大的支持。
2025/03/04

大模型RAG问答行业最佳案例及微调、推理双阶段实现模式
【AI驱动】
该工作所提出的模块化(Modular)RAG比较有趣,因此,今天我们来看看这个话题,价值之一在于,对RAG各个模块的方案进行了归置,对建立体系认知有帮助,供大家一起参考
2025/03/03

卷积神经网络和循环神经网络的代码实现
【AI驱动】
在 TensorFlow 中,通过 tensorflow.keras 模块构建 CNN 模型。首先加载 MNIST 数据集并进行归一化处理,接着构建包含卷积层(Conv2D)、池化层(MaxPooling2D)和全连接层(Dense)的顺序模型。训练模型时,使用 adam 优化器和 sparse_categorical_crossentropy 损失函数,通过 model.fit 方法进行训练。评估模型性能则通过 model.evaluate 方法。 在 PyTorch 中,同样加载 MNIST 数据集,并使用 torchvision.transforms 进行数据预处理。定义一个继承自 torch.nn.Module 的模型类,添加卷积层、池化层和全连接层。使用 torch.optim.Adam 和交叉熵损失函数训练模型,通过循环迭代数据加载器进行模型训练和评估。 循环神经网络(RNN): TensorFlow 实现的 RNN 使用 tensorflow.keras.layers.SimpleRNN 层。定义模型时,指定 RNN 单元数量和返回序列的参数,最后通过全连接层连接到输出层。PyTorch 实现的 RNN 定义一个自定义模型类,包含 nn.RNN 层和全连接层。使用 torch.optim.Adam 优化器和均方误差损失函数训练模型,通过循环迭代数据进行训练,并在测试集上评估模型性能。
2025/03/03

5 分钟用满血 DeepSeek R1 搭建个人 AI 知识库(含本地部署)
【AI驱动】
文章介绍了两种使用 DeepSeek R1 模型搭建个人知识库的方法:API 搭建和本地部署。对于不涉密数据且追求最佳效果的用户,推荐使用 API 搭建方式,具体步骤包括下载 Cherry Studio 软件、注册硅基流动平台获取免费额度、配置 API Key、选择 DeepSeek R1 模型、配置嵌入模型、创建知识库并上传文件进行向量化。对于有充足算力和希望保护数据安全的用户,可以选择本地部署方案,步骤包括下载 Ollama 软件、安装 DeepSeek R1 模型、使用 Cherry Studio 作为 UI 界面连接本地模型。文章还提到,DeepSeek 作为中国团队开发的世界级大模型,为用户提供了强大的 AI 功能,同时也展示了中国 AI 技术的进步。
2025/03/03

DeepSeek 使用指南:从 API Key 到本地部署,一步到位,推荐 3 款 AI 客户端
【AI驱动】
DeepSeek 近期在 AI 领域及大众中备受关注,预示着 2025 年 AI 技术将更普及。但其服务器卡顿问题影响了用户体验,为此 Chris 提供了包括获取官方 API Key、本地部署 DeepSeek 和推荐第三方 AI 客户端的解决方案。获取 API Key 可访问 DeepSeek 平台创建,但目前官方暂停充值服务。本地部署 DeepSeek 可通过 Ollama 工具实现,支持多种 AI 模型。对于不熟悉命令行的用户,推荐使用 ChatBox、CherryStudio 和 AnythingLLM 三款第三方 AI 客户端,它们支持多平台和多种 AI 模型,且注重本地数据存储与隐私保护。这些方法旨在帮助用户更高效地使用 DeepSeek,推动 AI 技术的普及与应用。
2025/03/03

基于DeepSeek-R1实现本地/API知识库,并接入微信BOT
【AI驱动】
本文详细介绍了搭建知识库并接入微信机器人的完整流程,包括环境配置、知识库部署、资料上传及细节调优技巧。DeepSeek 部署分为本地部署和第三方 API 调用两种方式,本地部署数据私有且响应快,但需较高硬件配置;API 调用快速接入且免维护,但数据需传输至第三方,长期成本不可控。知识库搭建使用开源框架 AnythingLLM,支持多模态模型,强调本地化和隐私保护。通过火山方舟和硅基流动平台获取 API 密钥,配置知识库时需填写相关参数,如请求地址、模型名称等。资料上传后需优化文档格式以提高 AI 理解准确性,如整理关键内容、删除无关信息。最后,通过生成 AnythingLLM 秘钥并配置 NGCBOT,将知识库接入微信机器人,实现智能问答功能。
2025/03/03

DeepSeek 技术分析 — (4)DualPipe
【AI驱动】
在深度学习中,前向传播和后向传播是训练神经网络的核心步骤。前向阶段,输入数据逐层通过网络生成输出;后向阶段,利用损失函数计算损失,通过链式法则反向传播梯度,并使用优化算法更新权重。对于大型语言模型(LLM),由于模型参数众多,无法装入单个 GPU 内存,需要采用模型并行和数据并行技术来加速训练。模型并行通过将模型按层或张量级别分区,分布到多个 GPU 上;数据并行则将模型复制到多个 GPU 上,独立生成梯度并同步更新。然而,大规模分布式训练面临资源利用、节点通信和同步等挑战。为充分利用集群计算资源,引入了多种管道并行技术,如 PipeDream 的“一前一后”(1F1B)调度策略,通过重叠通信和计算提高 GPU 利用率。零气泡流水线并行性进一步优化了计算和通信的重叠,减少流水线中的气泡。DeepSeek 从 V3 开始引入了 DualPipe 调度,通过细粒度阶段划分和双向流水线调度,提高了计算与通信的比率和效率,并定制了高效的跨节点全对全通信内核,充分利用集群的计算资源。
2025/03/03
搜索文章
热门话题