#梁文锋署名新论文曝光# 作为深耕大模型架构创新的领军者,梁文锋署名的DeepSeek新论文正式曝光,再次彰显其“技术男”核心底色与前沿科研视野。论文由其深度参与研发,核心聚焦大模型架构革新,创新性提出“条件记忆”稀疏轴,引入Engram模块构建“查算分离”双系统方案。该模块依托现代化哈希N-gram嵌入技术,以近似O(1)时间复杂度实现高效知识检索,专司静态知识存储;MoE架构则专注复杂逻辑推演与代码生成。实验证实二者存在“U形scaling law”,27B参数规模下,该架构在等参数算力条件下优于传统MoE基线,实现知识、推理、代码任务性能提升,为大模型稀疏性优化提供核心技术支撑,延续了其以算法创新突破行业瓶颈的科研路径。
发布于 福建
