看了一下这篇美国 AI 研究员 Nathan Lambert 在走访了月之暗面、智谱、美团、小米、通义千问、蚂蚁百灵、零一万物等机构之后,写的中国模型公司走访手记,主要是研究员之间的交流和视角,整理一下:
- 中国 AI 公司更喜欢雇佣在校生,而在美国,OpenAI、Anthropic、Cursor 等机构根本不提供实习机会
- 美国研究者更在乎个人声誉,因为自己的想法没有被纳入模型训练而导致的冲突时有发生
- 中美的文化差异导致美国模型公司更擅长创新,同时伴随着大量的炫技,很多时候目标并非是为了优化模型,也带来了很多组织内的博弈。而中国公司相对更务实地、全身心地投入优化模型,没有空谈,不参与 AI 如何影响未来的辩论(这是美国公司更喜欢讨论的话题)。
- 中国研究员也不喜欢讨论商业,而美国的每个人似乎都痴迷于各种生态层面的产业趋势——从数据贩售到算力资源或融资动态。
- 中国目前缺乏像 Dwarkesh 或 Lex 这类大型主流播客的平台,无法系统性地培育中国科学家的明星影响力。(锐评一下:这个说法无论是结论还是原因,都是错的。太低估中国媒体造星的能力了,中国明星科学家,一旦想要起飞,不要太容易,根本不需要 Lex 这类垂直媒体)
- 所有中国实验室都忌惮字节跳动及其热门的豆包模型——这是中国唯一前沿的闭源实验室。与此同时,所有实验室都对 DeepSeek 怀有深深的敬意,视其为研究品味与执行力俱佳的标杆。
- 中国大多数 AI 开发者都痴迷于 Claude,Codex 的提及次数极少——这款工具在旧金山湾区正迅速走红。
- 中国数据产业质量相对较低,往往自建环境或数据效果更佳。研究人员本身会投入大量时间构建强化学习训练环境,而像字节跳动、阿里巴巴这样的大型企业则拥有内部数据标注团队提供支持。而美国公司会为单个环境投入超千万美元,每年累计支出达数亿美元以推动强化学习前沿。中国公司更喜欢自建,美国公司更喜欢外采。
- 中国研究人员身上的人性光辉、独特魅力与真挚温暖,极具感染力。就个人感受而言,美国惯常的那种你死我活的地缘政治对话,丝毫未侵染他们的精神世界。这个世界正需要更多这样纯粹的正能量。
链接:www.interconnects.ai/p/notes-from-inside-chinas-ai-labs
