Kimi模型超越GPT-5

kimi thinking登顶，硅谷反应有点意思
刚刚，月之暗面新推出的开源推理模型Kimi K2 Thinking，在HLE、BrowseComp、SEAL-0等权威评测中，直接超越GPT-5、Claude Sonnet 4.5（Thinking）等闭源模型，拿下多项全球SOTA成绩。
更令人震撼的是，据外媒爆料，Kimi K2 Thinking训练成本仅460万美元。对比硅谷厂商动辄数亿美金的投入，Kimi只用了约1%的预算，却打磨出能连续推理200~300轮的顶尖模型。国外研究者Nathan Lambert由衷感叹：“这是开源模型距闭源前沿最近的一次。”
新模型上线后，不少开发者已完成Kimi K2 Thinking与GPT-5、Claude Sonnet 4.5的横向测试。开发者Lisan al Gaib评价道：“这是目前最好的开源模型，核心优势集中在代理任务和软件开发领域。更意外的是写作表现，它现在能给出更具个性化和情感温度的回应。”
回顾Kimi K2的迭代历程，其进步轨迹清晰可见：7月11日首次发布k2，总参数达1万亿，激活参数320亿；9月5日推出的Kimi K2-0905版本，重点升级Agentic Coding能力，还新增Claude Code支持。到了10月，这款中国模型彻底征服硅谷大佬：估值93亿美元的美国知名云平台Vercel CEO Guillermo Rauch公开表示，内部智能体真实场景测试中，Kimi K2表现优于GPT-5和Claude Sonnet 4.5；美国“SPAC之王”查马斯·帕利哈皮蒂亚在《All in》播客中透露，已将公司大量核心业务迁移至Kimi K2，彻底弃用Claude。
更具戏剧性的是估值反差。Kimi去年估值33亿美元，即便算上近期传言的新融资，估值仍停留在几十亿美元级别。而OpenAI最新估值5000亿美元，xAI（Grok）约2000亿美元，Anthropic达1830亿美元。换算下来，Kimi估值仅为OpenAI的0.5%，不足Anthropic和Grok的2%。
所以说，做顶级AI模型真不一定需要天价的算力投资。那么，行业是否又会像黄仁勋说的那样，中国将在人工智能竞赛中击败美国。

发布于浙江