所有文章 > AI驱动 > 利用Django基于LLM 大语言模型开发的知识库问答系统MaxKB

利用Django基于LLM 大语言模型开发的知识库问答系统MaxKB

MaxKB 是一款基于 LLM 大语言模型的知识库问答系统。MaxKB = Max Knowledge Base,旨在成为企业的最强大脑。

  • 开箱即用:支持直接上传文档、自动爬取在线文档,支持文本自动拆分、向量化,智能问答交互体验好;
  • 无缝嵌入:支持零编码快速嵌入到第三方业务系统;
  • 多模型支持:支持对接主流的大模型,包括 Ollama 本地私有大模型(如 Llama 2、Llama 3、qwen)、通义千问OpenAI、Azure OpenAI、Kimi、智谱 AI、讯飞星火和百度千帆大模型等。

技术栈

项目结构

├── LICENSE # License 申明
├── README.md
├── apps # 后端项目根目录
│ ├── common # 项目公共资源目录
│ ├── smartdoc # 项目主目录
│ ├── users # 用户相关
│ ├── manage.py # django项目入口
│ └── sdk # 项目通用的前后端依赖/网关的前端
├── pyproject.toml # 后端依赖 配置文件
└── ui # 前端项目根目录
├── config_example.yml # 项目配置示例
├── main.py # 项目入口文件 python main.py start 启动项目

快速安装开始

docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data 1panel/maxkb

# 用户名: admin
# 密码: MaxKB@123..

添加大模型,这里以添加Kimi大模型

在模型管理中,点击供应商【Kimi】,直接进入下一步填写Kimi的模型表单。    
或者左侧供应商先选择【Kimi】,然后点击【添加模型】,则直接进入Kimi的模型表单。
模型名称: MaxKB 中自定义的模型名称。
模型类型: 大语言模型。
基础模型: 为供应商的 LLM 模型,支持自定义输入,下拉选项是常用的一些大语言模型。
API 域名:https://api.moonshot.cn/v1
API Key:在Kimi 账户中心的 API Key 管理中获取 key。

创建知识库

打开【知识库】页面,点击【创建知识库】,进入创建知识库页面。

上传文档

输入知识库名称、知识库描述、选择通用型知识库类型。
然后将离线文档通过拖拽方式或选择文件上传方式进行上传。
上传文档要求:
支持的格式为Markdown、TXT、PDF、DOCX;
每次最多上传 50 个文件;
每个文件不超过 100 MB。

文档规范建议:
1、规范分段标识:离线文档的分段标识要有一定规范,否则拆分出来的段落会不规整。
2、段落要完整:一个分段中最好能描述一个完整的功能点或问题。

设置分段规则

当前支持智能分段和高级分段两种分段方式,推荐选择:智能分段。  
支持查看分段预览。

参考资料

项目github:https://github.com/1Panel-dev/MaxKB
Llama中文社区:https://github.com/LlamaFamily/Llama-Chinese
Llama3 中文仓库:https://github.com/CrazyBoyM/llama3-Chinese-chat

文章转自微信公众号@Python与Django学习

#你可能也喜欢这些API文章!