当前位置: 首页 > news >正文

Franky — 边缘计算智能语音助手 / Edge‑Computing Smart Voice Assistant

🎀 Franky — 边缘计算智能语音助手 / Edge‑Computing Smart Voice Assistant

🚀 简介|Introduction

我想自己做一款属于我的个性化的智能语音助手,受到儿子绘本的启发,我给它起名叫Franky,Franky是一款运行在 树莓派5(Raspberry Pi 5) 上的本地化智能语音助手,目前我就给它放在我的办公室,可以长时间低功耗运行,Franky已经成为了我日常的一部分了。

Franky虽然目前运行在树莓派上,但它不局限于只运行在树莓派,我选择的开发语言是python,喜欢的朋友也可以下载代码,在本地的电脑上就可以运行体验。

Franky可以通过语音或者webui控制,只需要保证同在一个局域网使用手机或者电脑控制。Franky提供了语音和粉色萌系的webui交互反馈,有很大的扩展空间。

✨ 核心特性|Key Features

编号特性功能
1🔔 关键词唤醒本地 Porcupine,响应快,无需联网
2🎙️ 语音识别通义千问实时语音识别
3🗣️ 文字转语音(TTS)通义千问CosyVoice模型,亲切自然
4🔊音频抢占调度音乐 ↔ TTS ↔ 提醒 互不打架
5🎵音乐支持音乐列表播放,暂停,继续、上一曲下一曲等操作
6📱联系人查询办公时,通过模糊姓名,拼音,手机或座机尾号查询联系人
5🤖 NLU 意图解析支持音乐、天气、提醒、联系人查询、聊天
6📆 定时/提醒语音或 WebUI 一键设定提醒,删除,提醒列表功能
7🌤️ 天气查询实时查询本地天气 API 获取并播报
8💬 多轮 LLM 聊天Qwen‑Turbo + 流式 TTS,聊天更流畅
9📷 图片理解通过拍照或者上传图片,理解图片内容
10🌈 粉色萌系 WebUISocket.IO 双向交互,实时可视化

🏗️ 架构|Architecture

架构设计的也比较简洁,输入通过语音或者WebUI交互输入,然后通过意图识别模块理解我的输入意图,最后分派给不同的任务处理,并反馈结果。

架构图如下,非常清晰。

架构

⚙️ 环境搭建|Setup

device

硬件方面,需要准备如下:

  • Raspberry Pi 5
  • USB 麦克风
  • 有线小音箱
  • 小屏幕

其实树莓派5也可以不用,本地的电脑就可以运行语音助手的代码,准备好这些东西就可以运行语音助手啦!


🎬 使用示例|Quick Demo

“Franky,播放音乐” → 背景歌单自动播放

playmusic

“Franky,今天天气怎么样” → 天气播报 +

weather

“Franky,提醒我下午 3 点开会” → 设置提醒 & 到点播报

reminder

WebUI 上传图片 → AI 图像理解结果实时返回

imageunderstand

Chat聊天 “Franky 罗湖区哪有好吃的” → AI 实时反馈

chatwithllm

“Franky,找5257或者找王xx → 工作常用联系人

query


🤝 贡献|Contributing

项目地址:https://github.com/gdhucoder/personalvoicehelper ,欢迎✨star 和交流🤝。


🧾 声明:所有内容均为我非工作时间的个人开发探索,技术探索过程公开透明,旨在分享语音交互领域的实战经验,不代表任何单位或组织,不涉及任何职务行为或工作成果,仅供学习参考。

http://www.dtcms.com/a/297206.html

相关文章:

  • 04-netty基础-Reactor三种模型
  • docker compose xtify-music-web
  • 华为OpenStack架构学习9篇 连载—— 02 OpenStack界面管理【附全文阅读】
  • VR 三维重建:重塑建筑工程全生命周期的数字化革命
  • [NLP]多电源域设计的仿真验证方法
  • Redis 5.0.14安装教程
  • Android 10.0 sts CtsSecurityBulletinHostTestCases的相关异常分析
  • 关于自定义域和 GitHub Pages(Windows)
  • OpenCV(04)梯度处理,边缘检测,绘制轮廓,凸包特征检测,轮廓特征查找
  • [python][flask]Flask-Login 使用详解
  • uniapp小程序上传图片并压缩
  • 吊汤:厨房的鲜味密码
  • 若依框架 ---一套快速开发平台
  • STM32-中断配置教程(寄存器版)
  • 【应急响应】进程隐藏技术与检测方式(二)
  • Gin 框架的中间件机制
  • 三种深度学习模型(GRU、CNN-GRU、贝叶斯优化的CNN-GRU/BO-CNN-GRU)对北半球光伏数据进行时间序列预测
  • win11 使用adb 获取安卓系统日志
  • ESP32学习笔记_Peripherals(4)——MCPWM基础使用
  • C++ : list的模拟
  • Kafka——多线程开发消费者实例
  • 使用OpenCV做个图片校正工具
  • 技术演进中的开发沉思-45 DELPHI VCL系列:6种方法
  • 关于新学C++编程Visual Studio 2022开始,使用Cmake工具构建Opencv和SDK在VS里编译项目开发简介笔记
  • RocketMQ常见问题梳理
  • 三、Spark 运行环境部署:全面掌握四种核心模式
  • 【内网穿透】使用FRP实现内网与公网Linux/Ubuntu服务器穿透项目部署多项目穿透方案
  • vue使用xlsx库导出excel
  • 编程语言Java——核心技术篇(三)异常处理详解
  • 字符串 “asdasjkfkasgfgshaahsfaf” 经过哈夫曼编码之后存储比特数是多少?