【当算法变成硬骨头:直接用硅片写出的Transformer】
开发者 Fabio Guzman 用门电路把一个带 KV cache 的 Transformer 模型直接“烧”成了芯片 GateGPT。没有 CPU、没有 GPU、没有操作系统,纯数字电路。
在 80 MHz 的极低频率下,它跑出了每秒 5.6 万个 Token。相比之下,我们 3000 MHz 的手机跑大模型还经常卡顿。
它的奥秘在于打破了“软件跑在硬件上”的套路,让 AI 变成了硬件本身。电信号通过电路的瞬间就是推理,没有任何系统和内存调度的开销。
虽然这只是个在 FPGA 上、只能在 LCD 屏上拼写名字的微型演示,但它给边缘端 AI 指明了方向:未来的物联网设备可能不需要昂贵的通用算力,一颗功耗极低、专模专用的定制芯片,就能在本地实现极速响应。这才是真正的软硬一体。
x.com/FGuzmanAI/status/2065832668172845209
#人工智能##AI创造营##芯片设计##边缘计算# http://t.cn/AXa0oZvP
发布于 北京
