腾讯砍Token额度

腾讯把员工的模型 Token 额度往下砍，其实不只是省钱，更像一次工程能力的验收。
额度一旦给得很高，很多团队会默认直接上最贵模型，workflow 也堆满高成本方案。对测试来说这种环境反而很难看出真实问题：用例一跑就过，缺陷被大模型能力掩盖，性能瓶颈也被算力硬顶过去。
额度收紧之后情况就变了。测试在设计回归用例、接口自动化和压测时，很快能看出哪些环节是真的工程质量，哪些只是模型在兜底。比如同一套测试数据，用不同模型跑出来的稳定性、响应时间、失败率差异都会被放大。
公司需求不会因为额度减少而减少，CI 里的回归、批量任务、评测脚本还是要跑。这时候团队到底是在做工程优化，还是单纯“烧 token”，基本一轮测试就能看出来。
某种程度上，这更像一次牌桌：强的是人、流程和测试体系，还是单纯模型能力。

发布于安徽