karminski-牙医 26-02-26 10:12
微博认证:AI博主

阶跃星辰在AMA中透露: Step 3.6 大约一个月后放出!

阶跃星辰刚刚在 Reddit 搞了首次 AMA. 他们的 CEO、CTO、首席科学家加上预训练和后训练研究员(我数了下11个人)都有参加, 回答了不少社区的尖锐问题, 我看到些感兴趣的给大家分享:

社区最关心的就是无限推理循环 Bug (24票最高). 团队目前正通过显式长度控制 RL + 跨推理力度训练来解决, 下个版本会修. 另一个痛点是工具调用首日翻车了 (18票) - 发布时 vllm/sglang/llama.cpp 的 tool calling 全挂了. CTO 直接道歉, 说测试只验证了数学和代码基准没覆盖工具调用, 承认经验不足. 目前已修复多个问题, 下个版本会成熟很多.

还有个有意思的: 社区问开放模型实验室最常犯什么错, CEO 回答"也许是不要在中国新年发模型?" 所以大家真的都卷得嗷嗷叫了哈哈哈

本地部署方面: 这部分信息量很大. CTO 亲口确认 Step 3.5 Flash 的 197B MoE 架构就是冲着 128GB 内存设计的 - CTO 自己自费买了台 128GB M3 Max MacBook, 首席科学家也买了 128GB 的 AMD Max+ AI 395. 发现 230B 的模型刚好超出 Mac 4-bit 量化能装得下的范围, 所以让团队往下调了一点, 这思路牛的 👍

然后未来规划: 官方说 Step 3.6 大约一个月后放出! 支持 thinking effort 开关; 年内会有更大参数的旗舰模型; 多模态视觉支持也在路上了.

我帖子整体阅读下来, 这次AMA团队回答问题很坦诚, 而且团队自己就是本地 LLM 用户. 目前最大的短板(包括reddit社区用于也说)是市场推广, CTO 自己也承认此前基本零推广. 他们认为技术品牌靠反复发布好模型来建立.

总之等一波 Step-3.6 !
#HOW I AI##阶跃星辰##StepFun#

发布于 北京