故事要从2015年的谷歌说起。那时候谷歌的工程师发现一个惊人的问题：如果有1亿安卓用户每天用语音转文字服务3分钟，消耗的算力竟然是谷歌所有数据中心算力的两倍！这直接把谷歌吓出一身冷汗——如果真这么搞下去，用传统CPU根本撑不住，效率低还烧钱。于是他们做了个大胆决定：甩开现成的芯片，自己造

故事要从2015年的谷歌说起。那时候谷歌的工程师发现一个惊人的问题：如果有1亿安卓用户每天用语音转文字服务3分钟，消耗的算力竟然是谷歌所有数据中心算力的两倍！这直接把谷歌吓出一身冷汗——如果真这么搞下去，用传统CPU根本撑不住，效率低还烧钱。于是他们做了个大胆决定：甩开现成的芯片，自己造专门给AI用的"定制芯片"。

这就是谷歌TPU（张量处理器）的诞生。第一代TPU像开了挂一样，专门针对机器学习优化，砍掉了用不上的高精度计算单元，只保留低精度模块（比如FP16/INT8），相当于给芯片做"瘦身手术"。结果效果拔群，成本直接砍半。比如最新一代TPU单颗成本只要3万人民币，比买英伟达的GPU便宜多了。谷歌现在都更新到第六代TPU了，70%的算力用在自家搜索、广告、YouTube这些核心业务，剩下的租给外面的AI创业公司用，连Midjourney这种当红炸子鸡都在用。

时间来到ChatGPT横空出世的时候。大模型参数直接飙到万亿级别，所有科技公司都疯了——买显卡的钱像烧纸一样。这时候大家突然发现，谷歌当年的路子真香啊！亚马逊2020年偷偷搞的自研芯片Trainium突然加速，Meta和特斯拉也加入战场。最狠的是亚马逊2024年底发布的第三代芯片，直接把定制芯片的热度推上巅峰。

发布于湖北