Deepseek V4很快要出来了
它的『国 产 化 』着实让人期待
训练真的摆脱了N卡吗?
对大模型训练而言
混合专家模型和稠密模型都很重要、也就是Moe和Dense、前者『突击效率』后者『突击稳定性』
能用🇨🇳卡训练出来万亿参数大模型
暂时看、是很疯狂的
卡片算力密度低、生态不完善,困难重重
阿妃的全🇨🇳算力平台、整出的千亿级参数规模稠密模型训练,已经了不得
这次DS的呈现,应该更漂亮
V4的出现,会强化星火的『能力壮大』、当然、也不排除V4是在星火千亿体量的攻克下获得了相关经验与借鉴,互利互惠
还有一点,它的成本优于N卡,成本是商业竞争的火车头
国产阵营的『估值重构』有望联袂出击
V4和星火会形成竞争态势吗?
精细化训练策略加持、中等规的模稠密模型可实现比肩万亿参数MoE模型的效果,将来、小星火优化后已经可以媲美V4了
实际应用场景中、已经够用、并且已深入布控各行各业『等别人迁移完、已经迟了』
也就是先发优势、技术+生态+客户三位一体壁垒
尤其在教育医疗政务军工等敏感领域
有概率成为国产大模型商业化的标杆
最后、大模型最后『活下来的有3-6家』
3年后,全国产化加持下留下来的,才是真模型
所以、投机这一块,丧坤也让出了40%覆盖昇腾
#单亲妈妈回应工地扛楼月入过万#
发布于 广东
