沧海一虫虫
26-06-04 22:11 微博认证:科技博主

#深圳一高校成功训练万亿级AI大模型#

终于来了!国产AI算力迎来里程碑时刻🔥

深圳河套学院联合多家单位近期依托昇腾910C国产AI算力集群,成功完成了1.6万亿参数大模型DeepSeek-V4-Pro全参数后训练!据公开资料,这是业界首个由第三方机构基于国产算力集群完成的该级别全参数后训练工程实践。

真·硬核突破,不是实验室花架子

团队在千卡级昇腾超节点上实现了1500+步长稳运行,训练全程无跳过、无异常报错;模型算力利用率MFU达到34.9% ,关键训练算子效率提升14%——这说明国产算力已从“能跑”进入“好用”阶段。

训练平台还在工业级自动化运筹建模场景中快速完成闭环验证,证明国产算力不仅能“训大模型”,更能“训好行业模型”。

不是炫技,是在“练兵”

更值得关注的是,河套学院把这次攻关直接作为人才培养“练兵场” ,将学生嵌入国产算力真实训练场景。截至目前,项目已培养学生42名,从算子调试到数据处理全面上手。学院执行院长罗智泉院士曾说:要“成为各位企业家所属企业的AI研究院,做大家的‘后院’”。

这次实践表明,中国AI产业在大模型训练领域正逐步具备不依赖海外算力的自主能力。国产算力+自主人才,这路走得稳。

#微博新知##ai创造营##科技##人工智能[超话]# http://t.cn/AXX6IKwY

发布于 广东