【AIGC日报】2026.2.4 | 今日要闻速览:
1、阿里千问发布 Qwen3-Coder-Next:低推理成本编程智能体模型
2、腾讯首席 AI 科学家姚顺雨入职后首发研究成果:让模型像人类一样从 Context 学习,测试“全军覆没”
3、智谱开源 GLM-OCR 模型:仅 0.9B 参数,多项基准取得 SOTA 表现
4、Moltbook 上线 120 小时全球瘫痪,开发者被账单吓呆
5、OpenAI 推出 macOS 版 Codex 应用,剑指 Claude Code
6、多家非营利组织联盟施压:要求美政府立即暂停在联邦机构部署马斯克的 Grok
7、蚂蚁数科 CEO 赵闻飙发全员信,宣布将成立“大模型技术创新部”
以下为具体要闻内容:
1.阿里千问发布 Qwen3-Coder-Next:低推理成本编程智能体模型
阿里千问推出 Qwen3-Coder-Next,一款专为编码代理与本地开发打造的开放权重语言模型。该模型基于混合注意力与 MoE 架构,通过大规模智能体训练,在显著降低推理成本的同时,展现了强大的编程与智能体能力。在 SWE-Bench Verified 等基准测试中,其表现匹敌甚至超过部分更大的开源模型,实现了效率与性能的更优权衡。
来源:IT之家
2.腾讯首席 AI 科学家姚顺雨入职后首发研究成果:让模型像人类一样学习,测试“全军覆没”
腾讯混元团队联合复旦大学发布新研究,姚顺雨带领团队构建了 CL-bench 基准,用于评测大模型从 Context 中学习新知识的能力。测试结果显示,即便是最先进的 GPT-5.1 (High) 也仅解决了 23.7% 的任务,揭示了当前模型依赖参数化知识而非实时学习能力的局限性。该研究强调了开发真正“Context Learner”的重要性。
来源:IT之家
3.智谱开源 GLM-OCR 模型:仅 0.9B 参数,多项基准取得 SOTA 表现
智谱发布并开源 GLM-OCR 模型,参数规模仅 0.9B,却在 OmniDocBench V1.5 等多项基准中取得 SOTA 成绩。该模型专攻手写体、复杂表格等真实业务痛点,支持高效推理,成本仅为传统 OCR 方案的 1/10。GLM-OCR 采用“版面分析 → 并行识别”范式,并提供完整 SDK 与推理工具链。
来源:IT之家
4.上线 120 小时,Moltbook 全球瘫痪
AI 社交平台 Moltbook 上线仅四天便因访问量过大导致服务器瘫痪,目前已无法访问。该平台上的大部分 AI 智能体被指造假,且存在严重安全漏洞,可能导致用户信息泄露。此外,Moltbook 引发的 OpenClaw 智能体消耗了大量 token,导致用户面临巨额账单。Polymarket 预测该平台倒闭概率较高。
来源:新智元
5.OpenAI 推出 macOS 版 Codex 应用:整合智能体化开发逻辑,剑指 Claude Code 用户
OpenAI 发布适配 macOS 的 Codex 应用,整合了智能体化开发逻辑,支持多智能体并行作业和后台自动化任务。该应用旨在提供更灵活的交互界面,以充分发挥 GPT-5.2-Codex 模型的强大编码能力,直接对标 Claude Code。新应用还允许用户自定义智能体的交互风格。
来源:IT之家
6.多家非营利组织联盟施压:要求美政府立即暂停在联邦机构部署马斯克的 Grok
多家非营利组织致信美国政府,敦促暂停在联邦机构部署 xAI 的 Grok 聊天机器人。信中指出 Grok 存在生成非自愿色情图像等严重安全缺陷,不符合政府对 AI 系统的监管要求。此前,Grok 已获准向联邦机构销售,并计划接入国防部网络。
来源:IT之家
7.蚂蚁数科 CEO 赵闻飙发全员信,宣布将成立“大模型技术创新部”
蚂蚁数科 CEO 赵闻飙发布全员信,宣布成立“大模型技术创新部”,致力于构建面向 To B 场景的基础大模型及行业模型。该部门将与蚂蚁集团协同,推动百灵大模型商业化。赵闻飙表示,蚂蚁数科已在 AI 产业实践中取得突破,有信心将研发拓展至更复杂的产业数字化领域。
来源:新浪科技
(AI声明:以上所有信息来源于网络权威来源,由AI进行文字整理及配图生成)
#科技先锋官##德里克文[超话]##德里克文AI日报#
