【DeepSeek新年论文居然没用CUDA,那梁文锋到底用的啥软件?】#deepseek##ai超级工厂##CUDA##大模型# 2026年首日,DeepSeek就用开源论文带来了他们在大模型架构上的一大创新。而更为重要的是,这次的工程实现完全完全基于北大开源框架 TileLang,而非CUDA,这次的工程优化并非依赖传统的英伟达CUDA手写算子,而是采用了北大开源框架 TileLang,来进行了绝大多数融合算子的开发。@新浪人工智能 http://t.cn/AXbiN8uT
发布于 北京
【DeepSeek新年论文居然没用CUDA,那梁文锋到底用的啥软件?】#deepseek##ai超级工厂##CUDA##大模型# 2026年首日,DeepSeek就用开源论文带来了他们在大模型架构上的一大创新。而更为重要的是,这次的工程实现完全完全基于北大开源框架 TileLang,而非CUDA,这次的工程优化并非依赖传统的英伟达CUDA手写算子,而是采用了北大开源框架 TileLang,来进行了绝大多数融合算子的开发。@新浪人工智能 http://t.cn/AXbiN8uT