坤小七Human
25-04-12 07:45 微博认证:财经观察官 财经博主

故事要从2015年的谷歌说起。那时候谷歌的工程师发现一个惊人的问题:如果有1亿安卓用户每天用语音转文字服务3分钟,消耗的算力竟然是谷歌所有数据中心算力的两倍!这直接把谷歌吓出一身冷汗——如果真这么搞下去,用传统CPU根本撑不住,效率低还烧钱。于是他们做了个大胆决定:甩开现成的芯片,自己造专门给AI用的"定制芯片"。

这就是谷歌TPU(张量处理器)的诞生。第一代TPU像开了挂一样,专门针对机器学习优化,砍掉了用不上的高精度计算单元,只保留低精度模块(比如FP16/INT8),相当于给芯片做"瘦身手术"。结果效果拔群,成本直接砍半。比如最新一代TPU单颗成本只要3万人民币,比买英伟达的GPU便宜多了。谷歌现在都更新到第六代TPU了,70%的算力用在自家搜索、广告、YouTube这些核心业务,剩下的租给外面的AI创业公司用,连Midjourney这种当红炸子鸡都在用。

时间来到ChatGPT横空出世的时候。大模型参数直接飙到万亿级别,所有科技公司都疯了——买显卡的钱像烧纸一样。这时候大家突然发现,谷歌当年的路子真香啊!亚马逊2020年偷偷搞的自研芯片Trainium突然加速,Meta和特斯拉也加入战场。最狠的是亚马逊2024年底发布的第三代芯片,直接把定制芯片的热度推上巅峰。

发布于 湖北