DeepSeek出圈的意义!
原创 社长说 研讯社
2025年01月26日 19:58 江苏 1414人
为百万财经人士倾心打造的投研资讯平台
为您解析宏观及政策、研判产业格局及动态,
与君共同见证中国资本市场的壮阔奋进时代!
——研讯社
周末,DeepSeek再次出圈。
起因是1月20日,量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1,然后近日最新评测的一些数据超预期,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。
并且在DeepSeek去年12月26日推出V3(对标4o),以及1月20日推出R1(对标o1)后,DeepSeek官网流量增长迅速,从12月26日的44万涨至1月21日的420万,增长了约十倍,目前网页端用户已超过豆包和Kimi,并且总体海外占72.1%,美国用户占比5.36%。
DeepSeek出圈的几个意义:
第一层,对DeepSeek来说,这次的出圈将大幅提升自身流量,对DeepSeek产业链式利好,类似之前的月之暗面-Kimi。
第二层,对AI发展来说,又是一个重要的里程碑事件,DeepSeek的开源+高性价比,将推动全球AI加速从训练进入推理时代。
一方面,DeepSeek-R1是开源模型,支持免费商用、任意修改和衍生开发等。图灵奖得主、Meta首席人工智能科学家LeCun最新表示,DeepSeek之所以这次一鸣惊人,是因为他们从开放研究和开源中获益。开源模型正在超越专有模型。开源模型更利于后续的普及推广。
另一方面,DeepSeek使用模型蒸馏技术使得训练提效,模型蒸馏是一种将大型复杂模型(教师模型)的知识迁移到小型轻量模型(学生模型)的技术,旨在保留高性能的同时降低计算成本和资源需求。其核心思想是通过模仿教师模型的输出分布(软标签)或中间特征,使学生模型学习到泛化能力和推理逻辑。
DeepSeek用更少的算力实现更复杂的任务,使得大模型不再局限于互联网巨头,将有更多的玩家可以参与进来,大模型真正实现大众化,万众创新、万众大模型,加速应用、端侧的普及。
周末还有一些声音在讨论DeepSeek是不是利空算力,其实这些都不重要了,因为AI正在加速进入推理时代,整个AI应用将迎来爆发,就像新能源汽车即将爆发的时候,就不要去抠这个锂电技术是不是会减少锂的用量了。
需要关注的是AI正在从训练到推理,从算力到应用。
第三层,对于国产AI来说,这次DeepSeek体现出国内大模型正在快速追赶海外大模型,尽管仍有较大差距,但这个差距正在缩小,大幅提振了国产大模型以及整个人工智能产业链发展的信心。
值得注意的是,目前的这些成绩都是在国内高端AI芯片持续受限的背景下做出来的,换句话说,这也意味着即便全面封锁,美国也难以阻止我国AI技术的进步。那么美国会不会重新审视自己的AI政策?
是进一步加大投入,再搞一次上世纪的“星球大战”,还是转向跟中国合作AI,实现共赢?
不管怎么选,对国内AI都是好事,全球AI都将进入新一轮加速期。
发布于 江西
