小黑夜之睛 25-11-08 22:41
微博认证:上海鑫宥投资管理有限公司 后勤 微博原创视频博主

kimi thinking登顶,硅谷反应有点意思
刚刚,月之暗面新推出的开源推理模型Kimi K2 Thinking,在HLE、BrowseComp、SEAL-0等权威评测中,直接超越GPT-5、Claude Sonnet 4.5(Thinking)等闭源模型,拿下多项全球SOTA成绩。
更令人震撼的是,据外媒爆料,Kimi K2 Thinking训练成本仅460万美元。对比硅谷厂商动辄数亿美金的投入,Kimi只用了约1%的预算,却打磨出能连续推理200~300轮的顶尖模型。国外研究者Nathan Lambert由衷感叹:“这是开源模型距闭源前沿最近的一次。”
新模型上线后,不少开发者已完成Kimi K2 Thinking与GPT-5、Claude Sonnet 4.5的横向测试。开发者Lisan al Gaib评价道:“这是目前最好的开源模型,核心优势集中在代理任务和软件开发领域。更意外的是写作表现,它现在能给出更具个性化和情感温度的回应。”
回顾Kimi K2的迭代历程,其进步轨迹清晰可见:7月11日首次发布k2,总参数达1万亿,激活参数320亿;9月5日推出的Kimi K2-0905版本,重点升级Agentic Coding能力,还新增Claude Code支持。到了10月,这款中国模型彻底征服硅谷大佬:估值93亿美元的美国知名云平台Vercel CEO Guillermo Rauch公开表示,内部智能体真实场景测试中,Kimi K2表现优于GPT-5和Claude Sonnet 4.5;美国“SPAC之王”查马斯·帕利哈皮蒂亚在《All in》播客中透露,已将公司大量核心业务迁移至Kimi K2,彻底弃用Claude。
更具戏剧性的是估值反差。Kimi去年估值33亿美元,即便算上近期传言的新融资,估值仍停留在几十亿美元级别。而OpenAI最新估值5000亿美元,xAI(Grok)约2000亿美元,Anthropic达1830亿美元。换算下来,Kimi估值仅为OpenAI的0.5%,不足Anthropic和Grok的2%。
所以说,做顶级AI模型真不一定需要天价的算力投资。那么,行业是否又会像黄仁勋说的那样,中国将在人工智能竞赛中击败美国。

发布于 浙江