到哪里都是主场 25-03-02 04:22

为什么大模型的性能优化来自中国公司?

从表面上看,中国工程师在大模型性能优化上取得突破,似乎是因为高端芯片受限,被迫在算法和算力效率上深耕。但更深层次的根源,实际上与美国企业内部的激励机制和管理模式密切相关。

对于美国的初创公司而言,能否融到更多资金、推高企业估值,很大程度上取决于他们向投资人展示的“规模感”——包括海量的数据、庞大的算力需求以及更高的烧钱速度。机器越多、人员越多,看起来项目越“有前途”,估值也更容易水涨船高。与其花大力气去打磨算法,不如通过不断扩张服务器、要更多预算,让“体量”显得更为宏大。这样做能迅速吸引投资人的目光,为公司拉来更多资金注入。

而在美国的大型公司内部,新成立的生成式 AI(GenAI)部门通常也面临类似的激励结构:大量申请硬件资源、扩充团队规模,往往能扩大在企业内部的“势力范围”,从而在组织架构和话语权上占得先机。如果部门负责人通过“要预算、要设备、要人力”就能拿到更多公司资源,自身地位就能得到巩固和提升。在这种环境下,工程师更多会选择加大硬件投入来快速达成业绩目标,而不会把精力放在艰难细致的优化工作上。

与之相比,中国工程师在硬件和芯片层面的限制下,往往被逼着从算法、系统以及硬件协同上挖掘极限性能。加上中国公司对研发成果的“短平快”要求,使得更高效的算法改进往往能即刻取得示范效应或商业收益。因此,中国团队在优化技术上更具执行力和热情,形成“有限资源—深入优化—成果显著”的良性循环。

概而言之,制约中国硬件供应的外部因素只是表象,更深层的差异在于美国企业内部资源竞逐与估值导向的文化,使得中国工程师在大模型性能优化上走出了一条“求精、求效”的发展路径。正是这些不同的激励机制与环境,造就了当前大模型性能优化更多地源自中国的现象。

发布于 美国