日常项目:私有化音箱

阅读量 ,评论量

私有化音箱

背景

  1. 因成本等原因,音箱提供的智能服务大部分都通过云计算获得,从根本上来说,用户隐私永远无法得到保护。

  2. 因为某些原因很少有一款能持续使用超过4年的,对于一些音箱深度用户来说,大大增加了深度使用的心理障碍,因为使用程度越深,到期更换成本越高。

  3. 市场上的智能音箱难以做个性化扩展,比如有的人希望早晨起床闹钟是唱一首歌(并让音箱给自己打个分)而非听一首歌😅。(科幻一下,将来的个性化扩展,通过copilot与用户交互,自动实现扩展功能;类似于现在音箱增加蓝牙外设的交互)

V1

基于stackchan项目二次开发。

方案

外设:

唤醒逻辑:

唤醒引擎

音频输出逻辑:

语言引擎

音频识别逻辑(为和模型对齐,话筒驱动采用16kHz采样率,16bit位深):

听力引擎

思考回答逻辑:

思考引擎

实施

工具计算示例:

知识问答示例:

后续优化

V2