地平线龙虾座舱方案

地平线的座舱龙虾，KaKaClaw咖咖虾，思路挺好的。

严格来说它不算一个操作系统，它只是封装了一堆skill进去，然后这些skill能够严格的按照座舱的功能进行分级、识别、执行。
所以在Skill这个层面就避免了大部分的安全问题，然后再结合权限，能调用啥，不能调用啥，这样座舱的功能就能做得很顺，很正常。
地平线特别优化的好的一点是，龙虾的反应速度特别快。从输入语音到语音输出和指令执行，中间没有太多的停顿，很流畅。有一点豆包打电话的感觉。

这个相较于之前Chatbot为主的座舱大模型应用明显高了一截。
之前的Chatbot为主的座舱大模型，主要是先识别语音，再做分类，然后实现。
它的分类不够精准，外加语音识别的问题，可能还需要反复确认，反倒就显得座舱不够智能。这样的问题，如果你们用大模型只做Chatbot就知道了。

但如果封装成 Skill 这些事就变得有意思起来了。
我的猜测是，步骤大体如下：
先做语音识别，然后用大模型修一遍做校正，这个环节就像豆包输入法，很快，但精准度高很多。
然后将指令识别，分类给不同的Skill去执行。然后Skill的执行中调用对应的功能和模块，这样整体的精准度会高很多，效率也高很多。

当然，我觉得这个跟龙虾的精髓，反倒相去甚远了。
龙虾的精髓其实是在于，实时编程、调用工具，解决问题，原来的Web coding是手搓代码，但还需要人类做确认。而龙虾把人类确认的这一步省了，直接搓完代码就执行。
但从安全的角度来说，车上，至少目前阶段，是断然不能上龙虾的。
安全问题无数人都念叨无数遍了，我觉得不需要我再念叨。

所以我觉得地平线，在当前的安全和AI的能力范围下，做的非常好的一个事例。
我觉得难道也不难，其他厂商应该很快都能接入进来，或者自己搓一个。
但怎么讲，我觉得地平线这家公司是有审美的。
既有技术的vision又有审美，还有能力。

终于能说话了，主要是吃力了一些

发布于北京