感觉DeepSeek V4的最大亮点应该是1M上下文,而且1M长度仅需10%显存。同样的显存,以前只能跑1个长上下文请求,现在理论上能跑10个,并发能力直接翻倍了[哆啦A梦吃惊] #deepseekv4#
发布于 福建
感觉DeepSeek V4的最大亮点应该是1M上下文,而且1M长度仅需10%显存。同样的显存,以前只能跑1个长上下文请求,现在理论上能跑10个,并发能力直接翻倍了[哆啦A梦吃惊] #deepseekv4#