DeepSeek曾尝试
用华为昇腾芯片训练推理模型 R2
但遭遇了反复失败、包括稳定性问题、芯片间互联速度慢、软件工具链不成熟等
最终退回英伟达硬件做训练
华为芯片只用于推理
『此时,仅剩一家在坚持』
DeepSeek V4模型即将发布
硬件使用策略:
“训练以英伟达为主,推理优先适配华为昇腾”
在轻量版和特定场景中会探索国产算力训练方案(国产苗头,待证实)
目前,大规模Moe训+推全用华为的,依旧只有『星火』
GLM-Image是用华为芯训练,但它更像是垂直模型,不是通用大模型,针对特定领域开发的[有人用过?图生成模型]
希望越来越多的AI厂商加入『国产阵营』
那么、国产AI领头羊群们的估值,才会异动[园丁][园丁]
同理、华为硬件也有概率走出来、
成为未来主线之一 #上证指数 sh000001#
结论:
Deepseek V4 开始用 → 华为推理
轻量化版本 开始用 → 华为训练+推理
国产生态阵营开始强大 → 国产大模型+国产算力替代 → 吸氧期后、有望成为新主场之一
发布于 广东
