为什么大模型的性能优化来自中国公司？从表面上看，中国工程师在大模型性能优化上取得突破，似乎是因为高端芯片受限，被迫在算法和算力效率上深耕。但更深层次的根源，实际上与美国企业内部的激励机制和管理模式密切相关。对于美国的初创公司而言，能否融到更多资金、推高企业估值，很大程度上取决

为什么大模型的性能优化来自中国公司？

从表面上看，中国工程师在大模型性能优化上取得突破，似乎是因为高端芯片受限，被迫在算法和算力效率上深耕。但更深层次的根源，实际上与美国企业内部的激励机制和管理模式密切相关。

对于美国的初创公司而言，能否融到更多资金、推高企业估值，很大程度上取决于他们向投资人展示的“规模感”——包括海量的数据、庞大的算力需求以及更高的烧钱速度。机器越多、人员越多，看起来项目越“有前途”，估值也更容易水涨船高。与其花大力气去打磨算法，不如通过不断扩张服务器、要更多预算，让“体量”显得更为宏大。这样做能迅速吸引投资人的目光，为公司拉来更多资金注入。

而在美国的大型公司内部，新成立的生成式 AI（GenAI）部门通常也面临类似的激励结构：大量申请硬件资源、扩充团队规模，往往能扩大在企业内部的“势力范围”，从而在组织架构和话语权上占得先机。如果部门负责人通过“要预算、要设备、要人力”就能拿到更多公司资源，自身地位就能得到巩固和提升。在这种环境下，工程师更多会选择加大硬件投入来快速达成业绩目标，而不会把精力放在艰难细致的优化工作上。

与之相比，中国工程师在硬件和芯片层面的限制下，往往被逼着从算法、系统以及硬件协同上挖掘极限性能。加上中国公司对研发成果的“短平快”要求，使得更高效的算法改进往往能即刻取得示范效应或商业收益。因此，中国团队在优化技术上更具执行力和热情，形成“有限资源—深入优化—成果显著”的良性循环。

概而言之，制约中国硬件供应的外部因素只是表象，更深层的差异在于美国企业内部资源竞逐与估值导向的文化，使得中国工程师在大模型性能优化上走出了一条“求精、求效”的发展路径。正是这些不同的激励机制与环境，造就了当前大模型性能优化更多地源自中国的现象。

发布于美国