使用DeepSeek R1、LangChain和Ollama构建端到端生成式人工智能应用

生成式人工智能正在改变我们与机器的交互方式，而DeepSeek R1作为一款强大的模型，在开发人工智能驱动的应用程序方面脱颖而出。本文将指导你如何使用DeepSeek R1、LangChain和Ollama构建一个端到端的生成式人工智能应用，确保数据隐私和效率。

开发环境搭建

安装Ollama和DeepSeek R1

构建人工智能应用的第一步是安装Ollama，它允许你在本地运行DeepSeek模型。从DeepSeek官网下载模型，并确保正确安装以避免安装问题。

选择合适的模型大小

DeepSeek R1提供从15亿到6710亿参数的多种模型。对于大多数初学者来说，15亿参数的模型是理想的选择，因为它能确保更快的性能和较低的资源需求。

常见安装问题排查

下载速度慢：检查你的网络速度，或者尝试在不同的时间下载。
缺少依赖项：根据Ollama的指南，确保安装了所有必要的包。
兼容性问题：验证你的系统是否满足运行DeepSeek的硬件要求。

DeepSeek R1与LangChain的集成

环境搭建与模型下载

在进行集成之前，先搭建本地环境并下载所需的模型。按照以下步骤操作：

在你的系统上安装Ollama。
从DeepSeek R1提供的参数大小中选择一个模型。
使用命令行将模型拉取到本地以供离线使用。

在本项目中，我们将使用30亿参数模型，以确保在性能和效率之间达到最佳平衡。

选择合适的LangChain组件

LangChain通过将人工智能模型连接到外部数据源，简化了人工智能应用的开发过程。首先创建一个虚拟环境，并安装必要的库：

pip install streamlit langchain-core langchain-community

构建生成式人工智能应用

构建提示链

提示链决定了人工智能如何响应用户输入。定义清晰的模板，包括用户内容、系统消息和人工智能生成的响应，以确保上下文感知的交互。

创建Streamlit界面

Streamlit提供了一种简单的方法来构建用户友好的人工智能应用。设置一个包含聊天窗口、输入框和提交按钮的界面，并应用自定义样式以提升用户体验：

复制

st.markdown("""

<style>

    .main { background-color: #1a1a1a; color: #ffffff; }

    .stTextInput textarea { color: #ffffff !important; }

</style>

""", unsafe_allow_html=True)

设计用户交互流程

用户应体验到无缝的对话过程。以问候开始，捕获查询，并提供准确的响应。存储聊天历史记录，以便进行上下文感知的回复。

处理用户输入并生成响应

捕获用户查询，并使用DeepSeek R1进行处理。以下是简化的聊天引擎实现：

复制

from langchain_ollama import ChatOllama

from langchain_core.output_parsers import StrOutputParser

复制

llm_engine = ChatOllama(

    model="deepseek-r1:3b",

    base_url="http://localhost:11434",

    temperature=0.3

)def generate_ai_response(prompt_chain):

    processing_pipeline = prompt_chain | llm_engine | StrOutputParser()

    return processing_pipeline.invoke({})

应用程序优化

为大型模型提升性能

对于大型模型，通过以下方式优化性能：

使用配备高内存和GPU支持的强大台式机。
实现多线程以高效处理多个请求。

实现错误处理和稳健性

通过有效处理错误，确保顺畅的用户体验：

复制

if user_query:

    try:

        prompt_chain = build_prompt_chain()

        ai_response = generate_ai_response(prompt_chain)

    except Exception as e:

        ai_response = f"Error: {str(e)}"