袁国庆 26-04-24 11:18
微博认证:科技博主 微博原创视频博主

#DeepSeekV4发布# DeepSeekV4终于发布了,简单总结下:

1、双版本发布:推出 DeepSeek-V4-Pro(高性能)和 DeepSeek-V4-Flash(高性价比)两个版本,可按需选择。

2、超长上下文:支持 1M token(约百万字) 的上下文长度,能一次性处理海量信息。

3、核心能力领先:在 Agent能力、世界知识和推理性能 三方面均达到国内及开源模型的领先水平。

4、具体任务表现:V4-Pro版本的代理编码能力接近顶尖闭源模型,在数学、编程等推理任务上超越所有已开源评测的模型。

5、技术创新与迁移提醒:采用 DSA稀疏注意力机制 降低长上下文计算成本;原有 deepseek-chat 等模型名3个月后停止使用,需迁移到新名称。

发布于 上海