远峰战略2025
26-05-23 14:58

英特尔推出本地+云端“混合龙虾” 号称能少烧多达7成云端Token。如果这个设想成立,那就有点意思了,这个核心逻辑应该是将部分大模型推理任务从云端下沉到本地端侧(PC、边缘设备)执行,从而减少与云端的大规模Token交互。如果“节省高达70%云端Token”的结论成立,它将深刻改变AI应用的成本结构和部署形态。

对于这个本地+云端“混合龙虾”,首先利好的就是AI应用里的大模型和端侧芯片。

发布于 浙江