开眼视点
26-06-29 08:33 微博认证:C114通信人家园3G版主、专栏作者李建昆,出版作品有《如影随形》 科技博主

腾讯把员工的模型 Token 额度往下砍,其实不只是省钱,更像一次工程能力的验收。
额度一旦给得很高,很多团队会默认直接上最贵模型,workflow 也堆满高成本方案。对测试来说这种环境反而很难看出真实问题:用例一跑就过,缺陷被大模型能力掩盖,性能瓶颈也被算力硬顶过去。
额度收紧之后情况就变了。测试在设计回归用例、接口自动化和压测时,很快能看出哪些环节是真的工程质量,哪些只是模型在兜底。比如同一套测试数据,用不同模型跑出来的稳定性、响应时间、失败率差异都会被放大。
公司需求不会因为额度减少而减少,CI 里的回归、批量任务、评测脚本还是要跑。这时候团队到底是在做工程优化,还是单纯“烧 token”,基本一轮测试就能看出来。
某种程度上,这更像一次牌桌:强的是人、流程和测试体系,还是单纯模型能力。

发布于 安徽