光头怪博士 26-03-25 00:42
微博认证:科学科普博主

明天是从早晨8点开始到下午5点都安排满了。无奈时差还在,还是睡不着。

今天听了Moonshot AI(@月之暗面Kimi )创始人杨植麟在GTC2026上介绍Kimi新进展的演讲,印象非常深刻!尽管不能完全理解所有介绍的技术细节,但能感觉到这是一位真的靠技术起家,而且发自内心热爱AI研究、热爱开源模型的创始人。后知后觉地刚知道这位牛逼的年轻人也是清华本科,曾经师从@唐杰THU 老师,而且本科的时候还玩摇滚,进过清华歌手大赛决赛。国内开源模型有这样的一批掌门人应该说真的是我们的幸运了。

从养龙虾以来,一直在用Kimi-K2.5驱动Yuzhe,日常体验非常好。最近在试用Hermes Agent,一个在设置上更适合做研究的AI Agent,推动一些小项目,在我睡觉的时候去洗数据、刷论文,背后用的是GLM-5,日常感受也很好。很多人纠结在某些高度复杂的编程任务、顶尖Benchmark、或者某些夸张的One-shot表现上国产开源模型和SOTA闭源还有差距,但这真的不是日常AI用户需要太操心的事情。我觉得我日常工作的复杂度和专业性已经超过90%的AI用户了,目前一线国产模型完全可以胜任大部分。对于我们这种面向数据科研,而非纯理论研究的人,工作中大部门任务国产开源模型已经都能搞定;搞不定的那些,说实话,也是我暂时不能信任任何模型的。科研流程从来都不是一时兴起的One-shot,而是需要人类用户注入灵光一现、定义好边界条件(Sanity check、各种测试、图表QA)、然后手牵手看着Agent从爬到走、再到一路小跑的过程。

所以我现在对待“AI for Science”的态度就是:尽量不参与任何“AI for Science”的讨论,就每天真的用AI做Science就好了。

如果有什么暴论的话,那大概就是:从今天开始算,如果在今后发表的工作里,AI的工作量没有接近50%,那么我们就是在浪费自己的精力。

发布于 美国