小财神乐韵传祺 26-04-11 10:16
微博认证:财经博主

Deepseek V4很快要出来了

它的『国 产 化 』着实让人期待

训练真的摆脱了N卡吗?

对大模型训练而言

混合专家模型和稠密模型都很重要、也就是Moe和Dense、前者『突击效率』后者『突击稳定性』

能用🇨🇳卡训练出来万亿参数大模型

暂时看、是很疯狂的

卡片算力密度低、生态不完善,困难重重

阿妃的全🇨🇳算力平台、整出的千亿级参数规模稠密模型训练,已经了不得

这次DS的呈现,应该更漂亮

V4的出现,会强化星火的『能力壮大』、当然、也不排除V4是在星火千亿体量的攻克下获得了相关经验与借鉴,互利互惠

还有一点,它的成本优于N卡,成本是商业竞争的火车头

国产阵营的『估值重构』有望联袂出击

V4和星火会形成竞争态势吗?

精细化训练策略加持、中等规的模稠密模型可实现比肩万亿参数MoE模型的效果,将来、小星火优化后已经可以媲美V4了

实际应用场景中、已经够用、并且已深入布控各行各业『等别人迁移完、已经迟了』

也就是先发优势、技术+生态+客户三位一体壁垒

尤其在教育医疗政务军工等敏感领域

有概率成为国产大模型商业化的标杆

最后、大模型最后『活下来的有3-6家』

3年后,全国产化加持下留下来的,才是真模型

所以、投机这一块,丧坤也让出了40%覆盖昇腾

#单亲妈妈回应工地扛楼月入过万#

发布于 广东