
MuselandAI替代方案与AI工具在求职中的应用
随着DeepSeek的热度不断攀升,关于如何复现或部署DeepSeek的文章层出不穷。无论是直接在官网使用,还是通过三方平台调用,无论是API接入亦或是本地及云端部署,归根结底还是在根据具体的情况从性能、费用和安全性的不可能三角中寻找平衡。
对大多数普通用户来说,第三方平台提供的网页、客户端和 API 服务可能是最便捷的选择。例如,阿里云推出的百炼API调用,具体教程可参考历史文章,这些服务不仅易于上手,还能提供稳定的支持和维护,确保用户体验的流畅性。
对于那些希望进一步自主部署但资源有限,并且需要推理加速和支持并发的用户,更便捷的云上一键部署方案是理想选择。这种方案开箱即用,具备弹性可伸缩和充足的算力优势,允许用户基于私有数据进行模型微调和参数调整,以适配垂直领域的需求。
基于函数计算部署 DeepSeek 模型,支持 Ollama/Transformers 等框架,并能构建多样化的模型对话界面,如 OpenWebui 和 ChatGPTNext。对于技术爱好者,试图做出更多尝试并且期望获得完全自主可控大模型的用户,使用 GPU 部署可以根据需求自定义环境配置,例如安装特定版本的 CUDA 和深度学习框架等。
GPU 服务器提供了强大的计算能力,适用于深度学习、科学计算、图形可视化和视频处理等多种应用场景。云端部署的优势:
部署效率与易用性
云端部署无需复杂的环境配置和硬件搭建,简单几步,最快 10 分钟就能快速实现不同尺寸的 DeepSeek 模型部署和应用。
算力需求与成本优化
云端部署提供了弹性、充足的算力支持,同时相比本地部署需要购买和维护昂贵的 GPU 硬件,云端部署按需付费的模式可以显著降低硬件成本。
唾手可得的创新资源
云端部署支持快速迭代和优化,开发者可以利用云平台提供的工具和资源,快速进行模型训练、调优和更新,加速创新。
本文介绍如何将 DeepSeek-R1 开源模型部署到 GPU 云服务器,在 GPU 云服务器上安装与配置 Ollama 和 Open WebUI。Ollama 负责托管 DeepSeek-R1 模型,Open WebUI 则为用户提供友好的交互界面。GPU 云服务器凭借其高性能并行计算架构,可以显著加速大模型的推理过程,特别是在处理大规模数据和高并发场景,可以有效提升推理速度和推理吞吐量。专有网络 VPC 和交换机用于资源隔离和安全管理,确保数据传输的安全性和网络的高可靠性。
本文以 DeepSeek-R1-Distill-Qwen-7B 为例进行演示,该版本是一个通过知识蒸馏技术从小型化模型中提取推理能力的高性能语言模型。它是基于 DeepSeek-R1 的推理能力,通过蒸馏技术将推理模式迁移到较小的 Qwen 模型上,从而在保持高效性能的同时降低了计算成本。用户可以根据实际需求选择其他参数规模的 DeepSeek-R1 模型,并相应调整实例规格配置。
按照本方案提供的配置完成部署后,会在阿里云上搭建一个如下图所示的运行环境。实际部署时,您可根据具体的资源规划调整部分配置,但最终的运行环境将与下图展示的架构相似。
在开始部署模型之前,需要进行一系列的环境准备工作。这些步骤包括创建专有网络 VPC 和交换机、配置安全组、创建 GPU 云服务器实例。
您需要创建专有网络 VPC 和交换机,为云服务器 ECS 实例构建云上的私有网络。
您已经创建了专有网络 VPC 和交换机。接下来您需要创建 1 个安全组,用于限制该专有网络 VPC 下交换机的网络流入和流出。
您已经创建好专有网络 VPC 和交换机等资源。接下来您需要创建 1 个 GPU 云服务器实例,用于部署应用程序。
接下来我们使用 Ollama 框架来部署 DeepSeek-R1 模型,使用 Open WebUI 调用模型服务。
curl -fsSL https://help-static-aliyun-doc.aliyuncs.com/install-script/deepseek-r1-for-platforms/ollama_install.sh|sh
如下图所示,说明 Ollama 部署完成。
ollama pull deepseek-r1:7b
ollama run deepseek-r1:7b &
curl -fsSL https://help-static-aliyun-doc.aliyuncs.com/install-script/deepseek-r1-for-platforms/install.sh|sh
2. 部署完成后,可以看到控制台中输出Installation completed。
说明
请将 <ECS公网IP> 更改为应用部署步骤记录的公网 IP。
文章转载自:部署DeepSeek,你的GPU够用吗?