【初创用3000万美元造一颗不可编程的AI芯片,推理速度却是Nvidia最强GPU的50倍】
2026 年 2 月 21 日,一家名为 Taalas 的芯片初创公司正式揭开面纱,发布了它的第一款产品:一颗将 Meta 的 Llama 3.1 8B 大语言模型几乎完整“刻进”硅片的推理芯片 HC1。按照该公司公布的数据,这颗芯片在单用户场景下可以跑到 17,000 tokens/s 的输出速度,大约是目前市面上最快竞品 Cerebras 的近 9 倍,是 Nvidia Blackwell 架构 GPU 的近 50 倍。构建成本据称只有同等 GPU 方案的二十分之一,功耗低一个数量级。
不过这颗芯片的局限也非常明显,那就是它只能跑 Llama 3.1 8B。要想换个模型?就只能再造一颗芯片。
这是 #AI芯片# 行业迄今为止最激进的专用化尝试,没有之一。
当前主流的推理部署依赖 GPU,尤其是 Nvidia 的 H100/H200 和最新的 Blackwell 系列。GPU 的优势在于通用性和成熟的软件生态,但它的架构天然存在一个瓶颈:计算单元和存储单元是分离的。模型的参数存储在 HBM(High Bandwidth Memory,高带宽内存)中,计算核心每次运算都需要从 HBM 搬运数据,这个搬运过程消耗大量能量和时间。
戳链接查看详情:http://t.cn/AXtF6fuM
