所有文章 > AI驱动 > 手把手教你免费把AI大模型接入小米音箱,无需任何代码基础,小白级基础详细操作教程!

手把手教你免费把AI大模型接入小米音箱,无需任何代码基础,小白级基础详细操作教程!

本次带来的是将大语言模型(AI)接入小爱音箱的教程。

教程原文:

项目官方简介:

项目地址:https://github.com/idootop/.git

官方教学视频:(不太适合小白)https://www.bilibili.com/video/BV1zb421H7cS/?vd_source=89579609ff9a5bb5330aaf89ebde811a视频配套 PPT 文件蓝奏云:https://wwt.lanzout.com/iLHm2238xf5c阿里云盘:https://www.alipan.com/s/Yf2RQvN961T

支持的小米音箱设备型号

✅ 完美运行

已知可以完美运行 Mi-GPT 的小爱音箱型号有:

名称型号ttsCommandwakeUpCommandplayingCommandstreamResponse反馈来源
小爱音箱 ProLX06[5, 1][5, 3]TRUE@idootop
小爱音箱 miniLX01[5, 1][5, 2][4, 1, 1]TRUE@gsscsd
小爱音箱 Play(2019 款)LX05[5, 1][5, 3][3, 1, 1]TRUE@wt666666
小爱音箱 万能遥控版LX5A[5, 1][5, 3]TRUE@imhsz
小米 AI 音箱S12[5, 1][5, 3]TRUE微信: CMSJ
小米 AI 音箱(第二代)L15A[7, 3][7, 1][3, 1, 1]TRUE微信: 龙之广
小爱智能家庭屏 10X10A[7, 3][7, 1]TRUE@IDarkBoss
Xiaomi Sound ProL17A[7, 3][7, 1]TRUE微信: eof

🚗 正常运行

部分机型的 MIoT 接口不支持查询设备播放状态或查询状态异常,比如小米音箱 Play 增强版(L05C),将会导致 MiGPT 部分功能异常,无法使用连续对话等,此时需要关闭 streamResponse

可以正常运行 Mi-GPT,但不支持连续对话的小爱音箱型号有:

名称型号ttsCommandwakeUpCommandplayingCommandstreamResponse反馈来源
小爱音箱L06A[5, 1][5, 2]FALSE@zhanglc
小爱音箱 PlayL05B[5, 3][5, 1]FALSE@BiuBiu2323
小米小爱音箱 Play 增强版L05C[5, 3][5, 1]FALSE@lyddias
Xiaomi 智能家庭屏 6X6A[7, 3][7, 1]FALSE@Hongwing
Redmi 小爱触屏音箱 Pro 8 英寸X08E[7, 3][7, 1]FALSE@shangjiyu
小爱音箱 ArtL09A[3, 1][3, 2]FALSE@zwsn
小爱触屏音箱LX04[5, 1][5, 2]FALSE@ilovesouthpark

❌ 不支持

完全不支持 MiGPT 的小爱音箱型号有:

名称型号反馈来源
小米小爱音箱 HDSM4@romantech
小米小爱蓝牙音箱随身版微信: 明天

案例设备:我用的是小米AI音箱 1代,S12

  • 先只看型号,找到自己小米音箱的型号是否在上面的列表当中

本地部署教学(Node.js)

  • 这个方案需要电脑一直开着migpt的服务才行,关了电脑大模型就不生效了,你可以把小爱同学当作你的电脑音箱,还是那种可以随时解答问题的音箱,其实也挺有意思的

准备完毕,部署开始:

第一步:电脑需要安装的软件和环境配置:

  • Python 3.8以上的版本 ( https://www.python.org/)
  • Vscode ( https://code.visualstudio.com/)
  • nodeJS (https://nodejs.org/zh-cn)
  • Github 需要有账号 (https://github.com/)
  • Github 经常会打不开,可以下载一个steam++,https://steampp.net/
  • 安装方法参考大雨老师的教学:本地电脑请安装VSCode,NodeJS,Git等

上述软件请自行安装完成(地址:https://waytoagi.feishu.cn/wiki/EJuiwrcJCi8uW1kTutrcBtBlnyc)重要!安装完成后,需要配置环境,否则后面的部署过程中运行会报错

  1. 搜索 windows powershell
  1. 用管理员身份运行,进入命令行工具页面
  1. 输入以下命令,按回车
Set-ExecutionPolicy RemoteSigned

第一次执行会弹出以下窗口,会出现执行策略更改确认时,输入A后按回车确认,关闭运行窗口

  • 这一步我们做的是安装软件,配置基础环境

第二步:准备小米音箱

  1. 查看小米音箱的型号
  2. 型号1:小米AI音箱(1代),这个型号根据前述表格,型号码为S12(底部标签不一致,请按表格中型号为准)
  1. 型号2:小米AI音箱(2代),型号码为L15A(看底部标签)
  1. 手机上下载米家APP或者小爱音箱APP,这里有几个参数要记住:
  • 小米账号:登录米家或者小爱音箱APP后,可以在”我的”界面中看到ID,我这里是9开头的一串数字
  • 记住登录小米账号的密码:记得使用密码登录,等下需要配置
  • 通过米家APP或小爱音箱APP配置小孩音箱设备,连接到家里的网络,请保持你连接的网络必须和电脑在同一局域网下
  • 记住音箱的名称:我这里就是 小米AI音箱
图片
图片
  • 在这一步,我们需要的参数是:小米UID,登录密码,音箱绑定的名称,我这里绑定的名称就是 小米AI音箱

第三步:申请大模型的API接口,以silicon为例

  • 官方提供的接入API的教学文档:https://migptgui.com/docs/apply/
  • 以我平时使用的silicon接口为例,有众多开源模型(Yi、Qwen、Llama、Gemma 等)免费使用。另赠送 14 元体验金,有效期未知,是个人认为API接口最方便最实惠的接口了
  • silicon注册和使用地址:https://cloud.siliconflow.cn/i/ESTKPm3J

邀请码:ESTKPm3J(谢谢支持)

  • 注册登录后,单击左边栏的API密钥,单击新建API密钥

单击密钥即可完成API密钥的复制

  • silicon支持多种大模型,也支持文生图、图生图、文生视频,可自行探索
  • 这一步得到silicon的密钥即可,我们可以调用千问2.5的这个模型,满足日常对话完全没有问题,并且是免费调用的
  • 这一步我们做的是注册silicon账号,申请API密钥,保存密钥,等下配置需要填写

第四步:进入github复制mi-gpt项目

  • 打开官方仓库:https://github.com/idootop/mi-gpt
  • Fork项目到自己的账号
  1. 单击Fork
  1. 单击右下角 Create fork
  1. 这样就已经把该项目fork到自己的仓库中了
  1. 找自己仓库项目的方法

进入主页,单击左上角的”三”

单击home,就可以看到刚才fork过来的mi-gpt项目了,单击可进入项目页面

  1. 复制仓库地址:先确认是否在自己的仓库项目页面,再单击绿色的“code”按钮,再点击地址栏的复制按钮
  • 这一步是复制官方项目到自己的仓库里,并得到自己的仓库地址

第五步:打开vscode,克隆项目,并找到配置文件

  1. 打开vscode
  1. 初次配置VScode,参考大雨老师教程第二天 如何在本地修改+AI交互当中vscode基本操作部分(教程地址:https://waytoagi.feishu.cn/wiki/LTRIwpdpoiGTTukcpBGcU0RJnse)
  • 安装中文插件,到下图这个界面,再次打开vscode就变成中文的了
  • 选择一个文件夹,文件夹名字请随便起,我们可以起一个migpt的文件夹,到下图这一步:
  • 如果弹出信任提示,单击“是”即可

在vscode中建立migpt项目终端,进入右图状态

输入 get clone 第四步复制的你自己仓库中项目地址:

如:git clone https://github.com/idootop/mi-gpt.git

按回车,克隆仓库项目,出先下图即克隆完成,点开左边栏mi-gpt就可以看到项目文件

如果出现这样的报错:

fatal: unable to access 'https://github.com/em......y/mi-gpt.git/': SSL certificate problem: unable to get local issuer certificate

,可运行下面的代码后重新克隆一遍

修改配置文件,这里两个带有example的文件就是我们需要修改的文件

重命名这两个文件,修改为.env和.migpt.js

第六步:修改vscode配置文件

修改.env文件,可参照官方文档

https://github.com/idootop/mi-gpt/blob/main/docs/settings.md

这里我们使用千问2.5-7b-instruction模型,配置参数如下:

OPENAI_MODEL = Qwen/Qwen2.5-7B-InstructOPENAI_API_KEY= sk-xxxxxxxx  
# 这里填写第三步中申请的API密钥即可
OPENAI_BASE_URL= https://api.siliconflow.cn/v1

修改完成后如下图:

接下来就可以配置.migpt.js文件,可参考官方文档修改指令和大模型的人设提示词

https://github.com/idootop/mi-gpt/blob/main/docs/prompt.md

https://github.com/idootop/mi-gpt/blob/main/docs/settings.md

填写第二步我们获得的小米ID等信息,分别对应小米账号ID,登录密码,设备名称,大概在93行左右

// 小米 ID
userId: "9xxxx", // 注意:不是手机号或邮箱,请在「个人信息」-「小米 ID」查看
// 账号密码
password: "axxxxx",
// 小爱音箱 DID 或在米家中设置的名称
did: "小米AI音箱", // 注意空格、大小写和错别字(音响 👉 音箱)

修改MIoT设备指令,如下图

  • 我自己的两台设备,我在表格中找到的指令是:
  • 我绑定了S12小米AI音箱,表中command分别是[5,1],[5,3],和默认的一致则不用修改,表中playingcommand为空,则不用添加
  • 如果是L15A,那么就要改成对应的编码,并把playingcommand之前的两个//删除,如下图
  • 切记,这里的所有符号必须使用英文符号,否则会报错

修改人设,可以参考官方文档,也可以自行设定,,可以先跑通再改,提供可复制的案例如下:

第4-16行,人物提示词,可以先跑通再改​

// 小爱音箱扮演角色的简介
const botProfile = `
性别:女
性格:高冷御姐
爱好:喜欢看电影,看书,偶尔也会去健身房锻炼,擅长游泳,爱吃醋,爱撒娇,喜欢思考哲学问题,很爱干净,喜欢穿性感服饰给哥哥看,特别喜欢挑逗哥哥。
`.trim();

// 小爱音箱主人(你)的简介
const masterProfile = `
性别:男
性格:善良正直
其他:明星,总喜欢打篮球,唱,跳,RAP,练习时长两年半,是莉莉娅的男朋友。
`.trim();
第78-87行,人物姓名(参考),可以先跑通再改
export default {
systemTemplate,
bot: {
name: "莉莉娅",
profile: botProfile,
},
master: {
name: "哥哥",
profile: masterProfile,
},

第104-119行,回复唤醒指令,更改姓名,让名字一致,可以先跑通再改

 // 当消息以下面的关键词开头时,会调用 AI 来回复消息
callAIKeywords: ["请", "你", "莉莉娅"],
// 当消息以下面的关键词开头时,会进入 AI 唤醒状态
wakeUpKeywords: ["打开", "进入", "召唤"],
// 当消息以下面的关键词开头时,会退出 AI 唤醒状态
exitKeywords: ["关闭", "退出", "再见"],
// 进入 AI 模式的欢迎语
onEnterAI: ["我是莉莉娅,又见到哥哥啦,太开心了"], // 设为空数组时可关闭提示语
// 退出 AI 模式的提示语
onExitAI: ["莉莉娅先回去咯"], // 为空时可关闭提示语
// AI 开始回答时的提示语
onAIAsking: ["让我先想想", "请稍等"], // 为空时可关闭提示语
// AI 结束回答时的提示语
onAIReplied: ["我说完了", "还有其他问题吗"], // 为空时可关闭提示语
// AI 回答异常时的提示语
onAIError: ["啊哦,出错了,请稍后再试吧!"], // 为空时可关闭提示语
可以选择关闭部分提示语,增加交互速度(推荐)
// 当消息以下面的关键词开头时,会调用 AI 来回复消息
callAIKeywords: ["请", "你", "莉莉娅"],
// 当消息以下面的关键词开头时,会进入 AI 唤醒状态
wakeUpKeywords: ["打开", "进入", "召唤"],
// 当消息以下面的关键词开头时,会退出 AI 唤醒状态
exitKeywords: ["关闭", "退出", "再见"],
// 进入 AI 模式的欢迎语
onEnterAI: ["我是莉莉娅,又见到哥哥啦,太开心了"], // 设为空数组时可关闭提示语
// 退出 AI 模式的提示语
onExitAI: ["莉莉娅先回去咯"], // 为空时可关闭提示语
// AI 开始回答时的提示语
onAIAsking: [], // 为空时可关闭提示语
// AI 结束回答时的提示语
onAIReplied: [], // 为空时可关闭提示语
// AI 回答异常时的提示语
onAIError: ["啊哦,出错了,请稍后再试吧!"], // 为空时可关闭提示语

第149-156行,打开连续对话功能,是否支持请根据官方文档自行判断

(部分机型的 MIoT 接口不支持查询设备播放状态或查询状态异常,比如小米音箱 Play 增强版(L05C),将会导致 MiGPT 部分功能异常,无法使用连续对话等,此时需要关闭 streamResponse。)

 // 是否启用连续对话功能,部分小爱音箱型号无法查询到正确的播放状态,需要关闭连续对话
streamResponse: true,
// 连续对话时,无响应多久后自动退出
exitKeepAliveAfter: 30, // 默认 30 秒,建议不要超过 1 分钟
// 连续对话时,下发 TTS 指令多长时间后开始检测设备播放状态(默认 3 秒)
checkTTSStatusAfter: 3, // 当小爱长文本回复被过早中断时,可尝试调大该值
// 连续对话时,播放状态检测间隔(单位毫秒,最低 500 毫秒,默认 1 秒)
checkInterval: 1000, // 调小此值可以降低小爱回复之间的停顿感,请酌情调节

这里一般只需要把连续对话功能改为true或false,如果设备支持可以改为true

保存文件,打开左上角文件,单击全部保存即可

第七步:安装依赖并运行

  1. 在下方终端窗口,单击终端,输入
    cd mi-gpt
 #这里的F:\migpt是你的文件夹目录,使用cd命令 进入mi-gpt文件
  1. 安装依赖,输入 pnpm install
pnpm install

安装完成后,界面如下:

如果安装过程报错,出现下图情况:

请在命令栏输入:npm cache clean –force 清除缓存后重新运行 pnpm install

npm cache clean --force
  1. 构建项目,输入 pnpm build
 pnpm build

出现以下界面即安装完成

如果出现以下报错,找到mi-gpt中 package.json文件,将第28行build进行修改

npx -y prisma generate && tsup

注意不要把引号删除。修改完成单击文件,一定要保存

保存后运行pnpm build,即可正常安装完成

  1. 运行项目,输入pnpm run dev
pnpm run dev
  1. 运行成功时,进入下图页面,每次对话都会在终端中显示
  1. 每次需要打开服务时,按照下图方式进入终端,先输入cd mi-gpt ,再运行 pnpm run dev 即可打开服务

如果出现以下错误不要慌,是网络问题,请重新运行

pnpm run dev
  1. 看下运行效果,记得给大模型思考的时间,说话太快会出问题的

原作者注:

  • 我自己也是个行业小白,没有任何计算机和代码的基础,教程是在一路摸索中总结出来的
  • 所有我遇到的报错,都是通过silicon的大模型来帮我解决,解决方案也都附上了
  • 使用docker更方便,只是我真的不会。
  • chat-tts的安装方法我搞了很久都没跑通,但我会继续摸索。
  • 这个小爱同学只能在服务开启的时候,也就是开着电脑同时开着服务才可以运行,听作者说如果在云端布置,需要用nas的docker,我还没学会。

教程结束

大模型真的深刻改变了我们的生活,把之前可能遥不可及或者要花费极大精力才能完成的事情,帮助我们成为了现实,我对此深有体会。

因此请放下大模型的宏观视角,忘记那些“AI榜单”、“替代人类”等带来的无谓焦虑和嘈杂信息。拥抱AI,切实的去体验一次大模型带来的改变,你也许会有新的感受。

最后,

愿每个人都能在AI的帮助下成为更好的自己。

文章转自微信公众号@Equity AI

#你可能也喜欢这些API文章!