说到电脑硬件就讲个5090的故事。
5090虽然是消费级显卡,但也算一个奇葩存在,因为其FP8算力强、带宽高、32GB显存又刚好卡住70B模型推理门槛,价格比专业算力卡便宜一大截,反而成了中小企业玩AI的首选。
而在5月这波token通胀中,5090算力租赁价格上涨幅度是最大的,因为中小企业也开始玩agent了。
我们知道,裸跑 Agent准确率只有13.8%,中小企业是怎么被忽悠进来的呢,根据厂商宣传,这次他们用的是封闭式的工程Agent。这种Agent 不碰 “高风险决策”,只切确定性强、试错成本低的场景,同时人机闭环:AI干80%高频、重复、耗时的脏活,人盯20%关键节点,这样可以把准确率提升到90%以上。
厂商为此描绘了这样一种美好的前景:某电商客服之前20人轮班,响应30秒,成本高,而靠Agent可以承接85%咨询,人工只处理15%复杂问题,人力降到8人,满意度从从4.2提升到了4.8,成本还降了十倍。
但实际应用下来,某电商真实情况是:42%参数错、38%结果编造、20%篡改正确数据。准确率最后只剩34%。
原因还是出在原理上,实际应用和理论环境千差万别,一步错,步步错,只要敢多步调用,准确率一定腰斩再腰斩。没救。
于是我们看到5090的算力租赁价格就这样坐了一趟过山车。
发布于 四川
