大家好,我是袋鼠帝,今天給大家?guī)戆?span textstyle="" class="cye-lm-tag">小米音箱接入AI的喂飯級教程,雖然已經有博主寫過這塊內容,但是呢,這次我并不是為了寫內容而寫,而是我真的想把我的小米音箱接入AI了,因為我忍它太久了(咬牙切齒)!
事情是這樣的,我這個小米音箱是3年前(22年3月5號購買的),價值299,還是什么升級款Pro,然而這三年我除了拿它當音響外,幾乎沒別的作用,,,最令人煩躁的是,每次我跟朋友吃開黑吃雞(PUBG),在戰(zhàn)局最激烈的時候,它老是莫名其妙搭腔,導致我不敢說話,不然它會一直吧吧(影響我和隊友聽腳步)喜歡打游戲的老哥應該懂。而且說話也是宛如zhizhang,完全沒有喚起語音功能的欲望。AI都爆發(fā)2年多了,我尋思小米應該能升級一下小愛了吧,結果還是一如既往的zhizhang(可能精力主要放在造車上了吧)地址:https://github.com/idootop/mi-gpt1.配置im-gpt項目文件;
2.docker啟動im-gpt;
3.如果要使用豆包音色,還需配置、啟動imgpt-tts項目;
4.修改im-gpt相關配置,重新啟動即可。
在開始之前,先看看您的小愛音箱是否在如下所支持的型號內本次使用docker一鍵啟動mi-gpt項目(要確保本地電腦已經安裝,并啟動了docker-desktop)有兩個配置文件:.env和.migpt.js(隨便放到某個文件夾下)也可公眾號后臺私信:“mi-gpt” 獲取兩個配置文件其中.env文件是配置AI老三樣的地方(模型名稱、apikey、api地址),這里模型我選擇deepseek-chat,也就是V3。也可以選擇API中轉站,比如kg中轉站:https://kg-api.cloud/PS:選擇中轉站的好處就是后續(xù)想換模型,只需要改模型名稱即可,非常方便。
api地址填:https://kg-api.cloud/v1這個配置文件中,我們重點關注userId(小米id)、password(小米賬號密碼)、和did在登錄頁面,用賬號、密碼登錄(密碼要記住,需要填寫到配置中的password處)登錄之后,點擊右下角 我的,下圖紅框中的數字,就是userId進入米家首頁,如下圖,音箱的名稱就是did(我的是 小愛音箱Pro)PS:音箱和電腦需要在同一局域網內(連同一個WiFi)
MIot的配置,我的是小愛音箱Pro,默認配置跟表格里面指定配置一樣,所以我的不用改下圖的配置中bot代表機器人的信息,master代表你自己的信息botProfile代表機器人的人設,masterProfile代表你自己的人設systemTemplate是系統(tǒng)提示詞,{{}}中的參數是變量名,程序啟動之后會自動替換成指定的值。另外如果您的小米機型不在如下行列,可以關閉streamResponse連續(xù)對話(設置為false)然后win+r,輸入cmd 回車,進入windows控制臺docker run -d --env-file $(pwd)/.env -v $(pwd)/.migpt.js:/app/.migpt.js idootop/mi-gpt:latest
注意??:$(pwd)要換成相關配置文件所在的絕對路徑比如我的兩個配置文件都在C:/Users/kangarooking/Documents/mi-gpt目錄,那么$(pwd)就替換成這段路徑即可docker run -d --env-file C:/Users/kangarooking/Documents/mi-gpt/.env -v C:/Users/kangarooking/Documents/mi-gpt/.migpt.js:/app/.migpt.js idootop/mi-gpt:latest
特別注意:大家在啟動mi-gpt的時候千萬不要開魔法,否則會判斷異地登錄,即便授權之后也要等1個小時才能再次用mi-gpt登錄,我就是忘關了,,,出現異地登錄的問題,請使用相同的魔法地址,瀏覽器登錄一下小米官網,重啟im-gpt服務就ok啦 后續(xù)修改配置,需要重啟im-gpt服務才會生效。然后提問的關鍵詞需要帶如下圖配置好的前綴,比如你要說:'你在干嘛',會喚起AI回復,如果你說:'在干嘛',是不會喚起AI回復的。如果你嫌棄小米原生語音的話,可以配置切換成豆包的語音(有多種音色可選)。地址:https://console.volcengine.com/speech/app創(chuàng)建應用之后,在語音合成這里找到appid和access token復制備用隨便找一個文件夾,創(chuàng)建一個.env文件,將如下內容復制到文件中# 基礎配置
# SECRET_PATH=你的接口訪問秘密路徑,比如:are-you-ok(可選)
TTS_DEFAULT_SPEAKER=東北老鐵
# 火山引擎,官方文檔:https://www.volcengine.com/docs/6561/79817
VOLCANO_TTS_APP_ID=2xxxx57
VOLCANO_TTS_ACCESS_TOKEN=wrI_xxxxxxxx_ADF
#VOLCANO_TTS_USER_ID=火山引擎賬號 ID(可選)
# 微軟必應 Read Aloud,官方文檔:https://www.microsoft.com/zh-cn/edge/features/read-aloud
EDGE_TTS_TRUSTED_TOKEN=你的必應 trust token,比如:6A5A-xxxx
# OpenAI TTS,官方文檔:https://platform.openai.com/docs/guides/text-to-speech
OPENAI_API_KEY=你的 OpenAI API Key,比如:sk-proj-xxxx
OPENAI_TTS_MODEL=tts-1
OPENAI_BASE_URL=https://api.openai.com/v1
VOLCANO_TTS_APP_ID=填寫語音合成的appid
VOLCANO_TTS_ACCESS_TOKEN=填寫語音合成的access token
TTS_DEFAULT_SPEAKER=選擇音色(寫音色名稱即可)
音色選擇地址:
https://github.com/idootop/mi-gpt-tts/blob/main/src/tts/volcano.ts
配置完成之后保存
win+r,輸入cmd 回車,進入windows控制臺
docker run -d --env-file ${pwd}/.env -p 3000:3000 idootop/mi-gpt-tts:latest
同樣${pwd}需要替換成.env文件所在的絕對路徑修改mi-gpt的.migpt.js配置文件,修改內容如下把TTS_BASE_URL的#號去掉,值改成migpt-tts的接口地址,但是域名不要寫localhost,寫你電腦的局域網ip地址局域網ip可以在控制臺通過ipconfig指令查看保存后最好刪除mi-gpt容器,重新執(zhí)行指令啟動。不過實測有個缺點:小愛會在AI回復之前搶答1~2秒,除了刷機,目前社區(qū)還沒有很好的解決方案。
本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現有害或侵權內容,請
點擊舉報。