【#思进摘要点评# GPU要凉?前英伟达AMD大神将AI刻在芯片上!17000 tokens/秒屠榜】(来源 | 新智元)【导读】在这个所有科技巨头都在为英伟达的高端GPU抢破头的时代,一家成立不到三年的多伦多小厂Taalas,突然朝着整个行业扔出了一颗反常识的「深水炸弹」:他们抛弃了液冷,抛弃了昂贵的HBM显存,甚至抛弃了「通用计算」,选择了一种最粗暴、最狂野的物理美学:直接把大模型焊死在芯片里!
加拿大多伦多(号称“北方硅谷”)初创公司Taalas推出HC1芯片,将Llama 3.1 8B大模型物理固化在芯片上,运行速度达17000 tokens/秒,较业界最快的Cerebras提升近10倍,较英伟达B200提升近50倍,同时抛弃液冷和HBM显存,成本仅为传统方案的1/20,功耗缩减至1/10,展现出极致的性能优势,虽目前关注度不高,却是今年极具分量的AI技术突破。
这款芯片由前英伟达、AMD大神领衔研发,采用“反向升级”思路,打破传统通用芯片的“内存墙”困境,通过存算合一设计消除数据搬运的延迟与能耗,用极致专用性换取速度与成本优势,引发行业广泛讨论。尽管其存在无法更换模型、小模型幻觉等局限,但并非“饮鸩止渴”。
Taalas的创新并非要取代GPU,而是开辟了AI芯片的新赛道,适配垂直场景的刚需,其低成本、高速度的特点,有望让AI渗透到更多日常场景。这种“暴力美学”式的突破,打破了传统AI硬件法则,既是对通用芯片路线的补充,也为AI走向物理世界提供了新可能,其长期价值值得期待……详情请见全文:http://t.cn/AXcZuKzf
发布于 上海
