DeepSeek模型长上下文性能稳定

在工程测试中发现，随着叠加复杂任务和提出修改意见时，国外三大模型在上下文长度达到约二十万时开始出现轻微性能损失，到四十万以上时性能下降80%，更多任务叠加后性能缓慢下滑。

而DeepSeek模型在百万千万级场景中性能损失较小，这得益于MHC技术和DSC系术化技术。

核心是通过局部信息比较检索与全局信号汇总，采用两层CCCC架构。#A股#

发布于韩国