坤小七Human 25-02-04 20:58
微博认证:财经观察官 财经博主

Deepseek产业链交流要点(仅供参考):

定位目标:打造中国最强的开源大模型,DeepSeek-V3目前参数规模670亿,商业化不是目前激进方向;

投入:训练不到2个月,花费不到600万美元,完成DeepSeek-V3的训练,25年整体资本开支5-6亿;

同行对比:DeepSeek还是属于大语言模型,跟ChatGPT、豆包的训练本身不在一个量级。现有的豆包或者智谱、KIMI、阿里通义千问,deepseek的逻辑推理能力还是强于它们,但是推理过程中情感化较弱;

发布于 北京