何漫游Alex
26-06-18 17:04 微博认证:幽默搞笑达人 AI博主

#谷歌天才研究员Shazeer跳槽OpenAI,被誉为“Transformer之父”#2017年,一篇叫《Attention Is All You Need》的论文提出了Transformer架构。八个作者之一就是Noam Shazeer。今天所有的大模型——ChatGPT、Claude、Gemini——都是从这篇论文的架构长出来的。

之后的故事很有意思。Shazeer当时在Google,他想做一个基于Transformer的聊天机器人产品。Google没同意。他离开了,自己创业做了Character.AI。2021年的事。

三年后,ChatGPT席卷全球。Google意识到自己不仅错过了产品窗口,还放跑了核心技术人才。2024年,他们花了27亿美元把Shazeer和他的团队买回来,让他担任Gemini模型的技术负责人,主导新一轮预训练。

今天他又走了。加入了OpenAI——那家用他的架构率先做出了ChatGPT的公司。

一个技术的发明人,在自己公司没有被允许把它做成产品。他离开、创业、被高价买回、带团队追了两年,最后还是去了那个证明了这项技术真正价值的公司。不太像是跳槽,更像是一个人在给自己当年的判断找一个答案。

Google的声明说"感谢多年贡献,祝一切顺利"。但对Gemini团队的影响不会小。更关键的是,Shazeer在OpenAI的工作方向不是产品迭代,是新模型架构的探索。这决定的是下一代模型的天花板。他选在OpenAI而不是Google做这件事,本身就说明了问题。

发布于 四川