#GitHub #AI

🤖 xiaozhi-esp32 - 小智 AI 聊天机器人

▎项目介绍:一个基于乐鑫 ESP-IDF 开发的开源项目,主要用于教学目的,旨在帮助学生和开发者了解如何将大型语言模型应用于硬件设备。

▎项目功能:
•网络连接:
支持 Wi-Fi 和 ML307 Cat.1 4G 模块,确保设备的联网能力。

•按键控制:
通过 BOOT 按键实现唤醒和中断,支持点击和长按两种触发方式。

•离线语音唤醒:
集成 ESP-SR,实现离线语音唤醒功能。

•流式语音对话:
支持通过 WebSocket 或 UDP 协议进行流式语音对话。

•多语言识别:
利用 SenseVoice,支持普通话、粤语、英语、日语和韩语的语音识别。

•声纹识别:
通过 3D Speaker 技术,识别是谁在呼叫 AI 的名字。

•大模型语音合成(TTS):
支持火山引擎或 CosyVoice 的语音合成功能。

•大型语言模型(LLM):
集成 Qwen2.5 72B 或豆包 API,实现智能对话。

•可配置的提示词和音色:
支持自定义角色的提示词和音色设置。

•短期记忆功能:
每轮对话后进行自我总结,提升交互体验。

•显示屏支持:
兼容 OLED 或 LCD 显示屏,显示信号强度或对话内容。


▎项目地址:点击打开
 
 
Back to Top