与英伟达员工(也是前谷歌员工)就英伟达 /ASIC 主题进行的一次非常有见地的采访:[吃瓜]
1. 他认为未来5年内, 英伟达和 ASIC 的比例不会是 50/50,而更可能是 80/20 或 70/30,更倾向于英伟达。他确实认为谷歌 TPU 可以节省成本,但性能不如英伟达 GPU。他提到,以每秒令牌数计算,TPU 每秒大约为 1500-2000 个令牌,而 H100 在优化设置下每秒为 2000-3500 个令牌。
2. 他举例说明了何时适合使用 TPU 或 GPU。他认为,如果运行 ChatGPT5 推理来执行诸如绘图之类的简单查询,TPU 会更具成本效益。他还提到,他们注意到谷歌正在为使用 TPU 的客户提供大幅折扣。
3. 他提到,在他看来,Elon 的 xAI 正在建立一支庞大的销售队伍并带来巨大的颠覆,他们的目标是销售计算并成为甲骨文 。
4. 他说, 英伟达在某些情况下会安装新的 GPU/加速器,并从客户那里回购旧的:»如果客户有 A100,并且他们想要使用 H100,我们会回购服务器和芯片,然后将其转售到海外。«
5. 他暗示,他相信CRWV在未来3-5年内将成为“绝对的庞然大物”,因为他们正在获得英伟达的优先权。他还暗示,在10月份的下一届GTC会议上,将会发布一些重要公告,特别是在美国制造业方面。
发布于 北京
