Deepseek 迟迟不出招,Kimi 来了个 1T 模型......没错,国产大模型的参数量干到「1 万亿」了!
MOE 结构,实际每次激活量应该是 32B,综合表现杀进第一梯队
在总算力严重受限的情况下,国产大模型死咬住美国佬不放,这恐怕是太平洋对面最害怕的情况
千问马上也要发新模型了,Deepseek 的大招要等到什么时候呢?
发布于 广东
Deepseek 迟迟不出招,Kimi 来了个 1T 模型......没错,国产大模型的参数量干到「1 万亿」了!
MOE 结构,实际每次激活量应该是 32B,综合表现杀进第一梯队
在总算力严重受限的情况下,国产大模型死咬住美国佬不放,这恐怕是太平洋对面最害怕的情况
千问马上也要发新模型了,Deepseek 的大招要等到什么时候呢?