科技公司发布AI模型

【AIGC日报】2026.2.4 | 今日要闻速览：

1、阿里千问发布 Qwen3-Coder-Next：低推理成本编程智能体模型
2、腾讯首席 AI 科学家姚顺雨入职后首发研究成果：让模型像人类一样从 Context 学习，测试“全军覆没”
3、智谱开源 GLM-OCR 模型：仅 0.9B 参数，多项基准取得 SOTA 表现
4、Moltbook 上线 120 小时全球瘫痪，开发者被账单吓呆
5、OpenAI 推出 macOS 版 Codex 应用，剑指 Claude Code
6、多家非营利组织联盟施压：要求美政府立即暂停在联邦机构部署马斯克的 Grok
7、蚂蚁数科 CEO 赵闻飙发全员信，宣布将成立“大模型技术创新部”

以下为具体要闻内容：

1.阿里千问发布 Qwen3-Coder-Next：低推理成本编程智能体模型

阿里千问推出 Qwen3-Coder-Next，一款专为编码代理与本地开发打造的开放权重语言模型。该模型基于混合注意力与 MoE 架构，通过大规模智能体训练，在显著降低推理成本的同时，展现了强大的编程与智能体能力。在 SWE-Bench Verified 等基准测试中，其表现匹敌甚至超过部分更大的开源模型，实现了效率与性能的更优权衡。
来源：IT之家

2.腾讯首席 AI 科学家姚顺雨入职后首发研究成果：让模型像人类一样学习，测试“全军覆没”

腾讯混元团队联合复旦大学发布新研究，姚顺雨带领团队构建了 CL-bench 基准，用于评测大模型从 Context 中学习新知识的能力。测试结果显示，即便是最先进的 GPT-5.1 (High) 也仅解决了 23.7% 的任务，揭示了当前模型依赖参数化知识而非实时学习能力的局限性。该研究强调了开发真正“Context Learner”的重要性。
来源：IT之家

3.智谱开源 GLM-OCR 模型：仅 0.9B 参数，多项基准取得 SOTA 表现

智谱发布并开源 GLM-OCR 模型，参数规模仅 0.9B，却在 OmniDocBench V1.5 等多项基准中取得 SOTA 成绩。该模型专攻手写体、复杂表格等真实业务痛点，支持高效推理，成本仅为传统 OCR 方案的 1/10。GLM-OCR 采用“版面分析 → 并行识别”范式，并提供完整 SDK 与推理工具链。
来源：IT之家

4.上线 120 小时，Moltbook 全球瘫痪

AI 社交平台 Moltbook 上线仅四天便因访问量过大导致服务器瘫痪，目前已无法访问。该平台上的大部分 AI 智能体被指造假，且存在严重安全漏洞，可能导致用户信息泄露。此外，Moltbook 引发的 OpenClaw 智能体消耗了大量 token，导致用户面临巨额账单。Polymarket 预测该平台倒闭概率较高。
来源：新智元

5.OpenAI 推出 macOS 版 Codex 应用：整合智能体化开发逻辑，剑指 Claude Code 用户

OpenAI 发布适配 macOS 的 Codex 应用，整合了智能体化开发逻辑，支持多智能体并行作业和后台自动化任务。该应用旨在提供更灵活的交互界面，以充分发挥 GPT-5.2-Codex 模型的强大编码能力，直接对标 Claude Code。新应用还允许用户自定义智能体的交互风格。
来源：IT之家

6.多家非营利组织联盟施压：要求美政府立即暂停在联邦机构部署马斯克的 Grok

多家非营利组织致信美国政府，敦促暂停在联邦机构部署 xAI 的 Grok 聊天机器人。信中指出 Grok 存在生成非自愿色情图像等严重安全缺陷，不符合政府对 AI 系统的监管要求。此前，Grok 已获准向联邦机构销售，并计划接入国防部网络。
来源：IT之家

7.蚂蚁数科 CEO 赵闻飙发全员信，宣布将成立“大模型技术创新部”

蚂蚁数科 CEO 赵闻飙发布全员信，宣布成立“大模型技术创新部”，致力于构建面向 To B 场景的基础大模型及行业模型。该部门将与蚂蚁集团协同，推动百灵大模型商业化。赵闻飙表示，蚂蚁数科已在 AI 产业实践中取得突破，有信心将研发拓展至更复杂的产业数字化领域。
来源：新浪科技

(AI声明：以上所有信息来源于网络权威来源，由AI进行文字整理及配图生成）
#科技先锋官##德里克文[超话]##德里克文AI日报#

发布于福建