黎夕朝暮一朵耘 26-04-18 20:06

V4延期的核心原因,跟模型本身关系不大。真正的难点,是一场底层硬件的大迁移DeepSeek之前所有模型都基于英伟达芯片训练。但V4走了一条不同的路。据路透报道,V4将运行在华为最新的昇腾芯片上。DeepSeek的工程师们花了大量时间解决V4对华为芯片的适配问题,重写核心代码,从英伟达的CUDA生态迁移到华为的CANN架构。如果V4在华为芯片上跑出有竞争力的性能,它将是全球第一个不依赖英伟达的前沿AI模型。(新智元)

发布于 新疆