突发:DeepSeek发布并开源 R1 模型 性能对标 OpenAI o1 正式版 输出价格只有1/27 http://t.cn/A63ZVSRs
DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。
在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
DeepSeek开源了DeepSeek-R1 和 DeepSeek-R1-Zero两个模型,660B 参数。
并通过模型蒸馏,开源 6 个小模型,其中 32B 和 70B 模型在多项能力上超越 OpenAI o1-mini。
API 价格简直逆天
API 定价:缓存命中每百万输入 tokens 1 元,未命中 4 元;输出 tokens 每百万 16 元。
开放授权:
采用标准 MIT License,无限制商用。
明确支持用户利用 DeepSeek-R1 输出训练其他模型。
发布于 日本
