DeepSeek更新有消息了。
上下文从128k升级至1M,提升了近10倍,理解能力大幅提升,可以随便装下一部长篇小说,训练库也更新至2025年5月,实测非联网状态下可准确输出2025年4月前的新闻。但依然不是多模态模型。
目前不知道有没有超预期的地方,也没有V4的确定消息,估计只是前菜,继续坐等升级。
发布于 广东
DeepSeek更新有消息了。
上下文从128k升级至1M,提升了近10倍,理解能力大幅提升,可以随便装下一部长篇小说,训练库也更新至2025年5月,实测非联网状态下可准确输出2025年4月前的新闻。但依然不是多模态模型。
目前不知道有没有超预期的地方,也没有V4的确定消息,估计只是前菜,继续坐等升级。