所有文章
> 当前分类:AI驱动

DeepSeek接入Python,一般电脑也能飞速跑,确实可以封神了!
2025/03/08
本文介绍了如何将DeepSeek最新推理模型R1接入Python编程环境,并在本地电脑上进行搭建。该方法不仅支持个人知识库管理,还能提高编程学习效率,且完全免费,不需要任何费用。推荐的搭建框架包括DeepSeek-r1:1.5b模型、PyCharm社区版开发环境和CodeGPT插件。DeepSeek-r1:1.5b模型即使在小参数尺寸下也能提供高质量的回答,适合没有大显存GPU的普通电脑使用,能够实现快速响应。文章详细描述了从安装PyCharm社区版到下载ollama软件并安装deepseek-r1:1.5b模型,再到将模型接入PyCharm的步骤。通过CodeGPT插件,用户可以在PyCharm中直接与DeepSeek-r1进行对话式提问,辅助编程学习,享受快速的本地运行体验,无需额外费用。

Manus替代品OpenManus:无需邀请码
【AI驱动】
文章介绍了OpenManus项目,这是一个由MetaGPT团队在GitHub上开源的项目,旨在复刻Manus的核心功能,从而打破AI Agent的「特权壁垒」。Manus是一款现象级产品,其内测邀请码曾被黄牛炒至5万元,但网友实测发现其任务执行延迟严重,服务器频繁崩溃。OpenManus项目提供了一个免费的、支持本地部署的解决方案,可以外挂任意工具链。
2025/03/08

DeepSeek 第二天开源的 DeepEP
【AI驱动】
在DeepSeek开源周的第二天,团队发布了DeepEP,这是一个专为混合专家模型(MoE)和专家并行(EP)设计的高效通信库。DeepEP针对DeepSeek-V3论文中提出的组限制门控算法进行了优化,并为非对称域带宽转发提供了高性能核心,这些核心不仅具有高吞吐量,适合训练和推理预填充任务,还支持流多处理器(SM)数量控制。对于延迟敏感的推理解码场景,DeepEP包含一组纯RDMA低延迟核心,将延迟降至最低,并引入了基于钩子的通信-计算重叠方法,不占用任何SM资源,进一步提升效率。
2025/03/08

DeepSeek 第五天开源的 3FS 文件系统
【AI驱动】
DeepSeek在其开源周的最后一天发布了支撑其V3/R1模型全生命周期数据访问需求的核心基础设施,包括Fire-Flyer File System(3FS)和构建于其上的Smallpond数据处理框架。3FS是一种并行文件系统,它充分利用现代SSD和RDMA网络的全带宽,在180节点集群上实现了6.6 TiB/s的聚合读取吞吐量,并在25节点集群的GraySort基准测试中达到3.66 TiB/分钟的吞吐量。3FS具有分离式架构、强一致性、文件接口等关键特性,并支持多样化工作负载,如数据准备、数据加载、检查点保存和推理KVCache。Smallpond是一个轻量级数据处理框架,建立在3FS之上,具有高性能、可扩展性和易用性特点,支持Python 3.8到3.12,可以通过pip安装。DeepSeek本周发布的技术栈还包括FlashMLA、DeepEP、DeepGEMM以及并行计算策略,展示了其在大模型技术领域的全面布局。
2025/03/08

DeepSeek 第四天开源的模型设计套件
【AI驱动】
DeepSeek在第四天开源了一套专为大规模AI模型设计的并行计算策略优化工具,包括DualPipe、EPLB和Profile-data三个项目。DualPipe是一种双向流水线并行算法,实现了前向和后向计算过程的计算-通信阶段完全重叠,减少了流水线气泡。EPLB是专家并行负载均衡器,通过复制工作量大的专家并合理分配到各GPU上,确保负载均衡。Profile-data提供了性能分析数据集,帮助社区理解计算与通信重叠的性能。这些工具共同支撑了DeepSeek-V3模型的高效训练和推理并行处理能力。
2025/03/08

DeepSeek 第三天开源的 DeepGEMM
【AI驱动】
在DeepSeek开源周的第三天,团队发布了DeepGEMM,这是一个专为Hopper架构GPU优化的矩阵乘法库。DeepGEMM支持标准矩阵计算和混合专家模型(MoE)计算,为DeepSeek-V3/R1的训练和推理提供支持,并在Hopper GPU上实现了1350+ FP8 TFLOPS的高性能。该库的核心代码简洁高效,仅约300行,且在大多数矩阵尺寸下性能优于现有解决方案。DeepGEMM支持三种数据排列方式,包括标准排列和两种专为混合专家模型设计的特殊排列(连续排列和掩码排列),并采用即时编译技术,无需在安装时进行编译。
2025/03/08

如何在本地运行 DeepSeek
【AI驱动】
DeepSeek-R1作为一款开源的AI模型,因其出色的性能和成本效益而受到广泛关注。它不仅在问题解决、推理和编码方面表现出色,还通过内置的链式思考推理提升了效率。本文详细介绍了如何使用Ollama在本地免费运行DeepSeek-R1模型,整个过程仅需3分钟。通过简单的安装步骤,用户可以快速下载并启动该模型,实现在本地与DeepSeek-R1的交互。此外,文章还提供了如何结合SingleStore数据库和LangChain框架构建RAG应用的教程。通过NVIDIA NIM微服务获取DeepSeek-R1的API密钥后,用户可以利用LangChain将模型与SingleStore数据库连接,实现对自定义文档的查询和分析。这一过程不仅展示了DeepSeek-R1的强大功能,还为开发者提供了在本地运行和部署AI模型的实用指南。
2025/03/07

DeepSeek引发比特币下跌:市场波动背后的真相
【AI驱动】
近期,比特币市场经历了一轮显著波动,其价格在短时间内大幅下跌。尽管中国初创公司 DeepSeek 并未直接涉及比特币领域,但其引发的市场连锁反应却对比特币价格产生了显著影响。DeepSeek 提出的低成本人工智能模型引发了科技股的抛售潮,进而影响了比特币市场。比特币价格的下跌并非孤立事件,而是与科技股市场的整体表现密切相关。数据显示,比特币与纳斯达克指数的相关性在近期达到了0.5,显示出两者之间强烈的联动性。此外,比特币挖矿行业也受到了波及,相关公司股价出现了大幅下跌。尽管如此,市场对比特币的长期前景仍保持乐观,其价格走势将继续受到市场情绪和宏观经济环境的影响。投资者在面对短期波动时应保持谨慎,同时关注市场动态和政策变化。
2025/03/07

全网都在要Manus AI邀请码,可能是 DeepSeek 后最大惊喜
【AI驱动】
Manus AI 由Monica开发,是一款能够自主完成复杂任务的通用AI代理工具,例如筛选简历、房产分析和股票研究等。它强调简单易用和高质量成果,用户只需输入简单指令即可获得输出,其官网展示的应用实例也凸显了其解决现实问题的潜力。感谢您的指正,我会确保后续回答更加准确。
2025/03/07

一文搞懂什么是Manus,附实战案例
【AI驱动】
Manus 是一款由中国Monica.im团队于2025年3月5日发布的全球首款通用型AI智能体产品,其开发团队成立于2023年,专注于人工智能助手的开发。其核心定位是能够自主规划并执行复杂任务,直接交付完整成果,而不仅仅是提供建议或答案。
2025/03/07

通用AI智能体Manus详情介绍
【AI驱动】
通用AI智能体Manus是一种融合自然语言处理、多模态学习和强化学习的新型人工智能技术,其核心优势在于跨领域的智能化交互能力。在游戏领域,Manus通过动态调整NPC行为提升玩家体验;在金融科技中,它通过实时数据分析提供个性化投资建议。此外,Manus在模型轻量化、隐私保护等热点技术上也取得了显著进展。未来,随着技术优化与新场景探索的深入,通用AI智能体Manus有望成为人工智能发展的重要推动力量。
2025/03/06

DeepSeek R1 简单指南:架构、训练、本地部署和硬件要求
【AI驱动】
DeepSeek R1 是一种大型语言模型(LLM),通过强化学习(RL)显著提升了推理能力。与传统模型不同,它主要依赖强化学习而非监督学习,通过小组相对策略优化(GRPO)提高准确性和格式奖励,从而增强推理能力。
2025/03/06

Claude 3.7使用:全面指南与技术解析
【AI驱动】
Claude 3.7 Sonnet作为Anthropic公司最新发布的人工智能模型,凭借其混合推理能力和卓越性能,成为当前AI领域的焦点。本文详细介绍了Claude 3.7的使用方法,包括官方渠道和第三方平台,如Claude官网、Slack集成、Poe平台、ChatShare、Trae、Sider、Lmsys和Perplexity等。同时,针对国内用户,提供了通过AWS的Claude API、借助海外资源直接使用以及使用AI聚合站等策略。技术特点方面,Claude 3.7具备混合推理能力、强大的编码性能和灵活的输出容量,适用于多种实际应用场景,如医疗保健、金融服务和开发与编程。通过性能对比数据和示例代码,本文为用户提供了全面的技术解析和使用指南,帮助用户更好地理解和应用Claude 3.7 Sonnet。
2025/03/04

Wan2.1:开源AI视频模型的崛起,超越Sora的视频生成技术
【AI驱动】
Wan2.1 是由阿里巴巴云开发的一款开源AI模型,专为高效、高质量的视频生成而设计。它在多个方面表现出色,包括文本到视频(T2V)、图像到视频(I2V)、视频编辑和文本到图像(T2I)等功能,并且能够生成中英文双语字幕,使其在多语言应用场景中具有独特优势。Wan2.1 基于扩散变换器范式构建,通过流匹配框架增强,其核心创新包括 Wan-VAE 和 Video Diffusion DiT,能够高效处理1080P视频并保持时间连贯性。在 VBench 基准测试中,Wan2.1 的总体得分为86.22%,超越了竞争对手 Sora 的84.28%。它在 ID 一致性、单对象准确性和空间位置准确性方面表现出色,尽管在运动平滑性和大运动生成方面略逊一筹,但差距非常小。Wan2.1 的开源特性使其对开发者极为友好,开发者可以轻松获取其代码并进行定制和集成。其应用场景广泛,涵盖内容创作、教育、影视、广告、游戏等多个领域,能够为不同行业提供强大的支持。
2025/03/04

大模型RAG问答行业最佳案例及微调、推理双阶段实现模式
【AI驱动】
该工作所提出的模块化(Modular)RAG比较有趣,因此,今天我们来看看这个话题,价值之一在于,对RAG各个模块的方案进行了归置,对建立体系认知有帮助,供大家一起参考
2025/03/03

卷积神经网络和循环神经网络的代码实现
【AI驱动】
在 TensorFlow 中,通过 tensorflow.keras 模块构建 CNN 模型。首先加载 MNIST 数据集并进行归一化处理,接着构建包含卷积层(Conv2D)、池化层(MaxPooling2D)和全连接层(Dense)的顺序模型。训练模型时,使用 adam 优化器和 sparse_categorical_crossentropy 损失函数,通过 model.fit 方法进行训练。评估模型性能则通过 model.evaluate 方法。 在 PyTorch 中,同样加载 MNIST 数据集,并使用 torchvision.transforms 进行数据预处理。定义一个继承自 torch.nn.Module 的模型类,添加卷积层、池化层和全连接层。使用 torch.optim.Adam 和交叉熵损失函数训练模型,通过循环迭代数据加载器进行模型训练和评估。 循环神经网络(RNN): TensorFlow 实现的 RNN 使用 tensorflow.keras.layers.SimpleRNN 层。定义模型时,指定 RNN 单元数量和返回序列的参数,最后通过全连接层连接到输出层。PyTorch 实现的 RNN 定义一个自定义模型类,包含 nn.RNN 层和全连接层。使用 torch.optim.Adam 优化器和均方误差损失函数训练模型,通过循环迭代数据进行训练,并在测试集上评估模型性能。
2025/03/03
搜索文章
热门话题