地平线的座舱龙虾,KaKaClaw咖咖虾,思路挺好的。
严格来说它不算一个操作系统,它只是封装了一堆skill进去,然后这些skill能够严格的按照座舱的功能进行分级、识别、执行。
所以在Skill这个层面就避免了大部分的安全问题,然后再结合权限,能调用啥,不能调用啥,这样座舱的功能就能做得很顺,很正常。
地平线特别优化的好的一点是,龙虾的反应速度特别快。从输入语音到语音输出和指令执行,中间没有太多的停顿,很流畅。有一点豆包打电话的感觉。
这个相较于之前Chatbot为主的座舱大模型应用明显高了一截。
之前的Chatbot为主的座舱大模型,主要是先识别语音,再做分类,然后实现。
它的分类不够精准,外加语音识别的问题,可能还需要反复确认,反倒就显得座舱不够智能。这样的问题,如果你们用大模型只做Chatbot就知道了。
但如果封装成 Skill 这些事就变得有意思起来了。
我的猜测是,步骤大体如下:
先做语音识别,然后用大模型修一遍做校正,这个环节就像豆包输入法,很快,但精准度高很多。
然后将指令识别,分类给不同的Skill去执行。然后Skill的执行中调用对应的功能和模块,这样整体的精准度会高很多,效率也高很多。
当然,我觉得这个跟龙虾的精髓,反倒相去甚远了。
龙虾的精髓其实是在于,实时编程、调用工具,解决问题,原来的Web coding是手搓代码,但还需要人类做确认。而龙虾把人类确认的这一步省了,直接搓完代码就执行。
但从安全的角度来说,车上,至少目前阶段,是断然不能上龙虾的。
安全问题无数人都念叨无数遍了,我觉得不需要我再念叨。
所以我觉得地平线,在当前的安全和AI的能力范围下,做的非常好的一个事例。
我觉得难道也不难,其他厂商应该很快都能接入进来,或者自己搓一个。
但怎么讲,我觉得地平线这家公司是有审美的。
既有技术的vision又有审美,还有能力。
终于能说话了,主要是吃力了一些
