英特尔推出混合龙虾

英特尔推出本地+云端“混合龙虾” 号称能少烧多达7成云端Token。如果这个设想成立，那就有点意思了，这个核心逻辑应该是将部分大模型推理任务从云端下沉到本地端侧（PC、边缘设备）执行，从而减少与云端的大规模Token交互。如果“节省高达70%云端Token”的结论成立，它将深刻改变AI应用的成本结构和部署形态。

对于这个本地+云端“混合龙虾”，首先利好的就是AI应用里的大模型和端侧芯片。

发布于浙江