中国大模型今天面临的核心矛盾,已经不是「模型能力够不够强」,而是「模型能力如何转化成用户规模和生态优势」。
如果把时间拨回2023年,大家讨论的是:
* GPT-4领先多少?
* 参数量多少?
* 训练多少Token?
* 算力缺口多大?
但到了2026年,这些已经不是决定胜负的第一因素了。
看看今天的格局:
* OpenAI 靠ChatGPT拥有数亿级用户
* Anthropic 靠Claude占据程序员和知识工作者市场
* Google 靠Gemini嵌入安卓和搜索生态
* 字节跳动 靠豆包吃下中国最大C端流量
* DeepSeek 靠开源和低成本迅速扩散
而反观很多中国大模型公司:
* 技术很强
* 论文很多
* 榜单成绩很好
* 但用户不知道在哪里
这其实是一个非常残酷的现实。
第一阶段:拼模型
2018-2024年是拼模型。
谁能训练出来。
谁能把推理能力做出来。
谁能把成本降下来。
这一阶段中国追得非常快。
包括:
* 华为 盘古
* 小米 MiMo
* 理想汽车 MindGPT体系
* DeepSeek
* 豆包
* 通义
* 混元
其实已经证明中国具备训练世界级模型的能力。
第二阶段:拼用户
今天已经进入第二阶段。
用户为什么用你?
用户每天打开你几次?
用户愿不愿意把工作交给你?
用户会不会形成习惯?
这比论文重要得多。
因为模型能力差5%,用户可能感觉不到。
但产品体验差5%,用户立刻就跑了。
举个例子。
很多人说Claude比GPT聪明。
很多人说DeepSeek推理能力不输国外。
但为什么ChatGPT用户还是这么多?
因为ChatGPT已经变成了工作流。
用户的聊天记录在里面。
项目在里面。
记忆在里面。
插件在里面。
习惯在里面。
迁移成本越来越高。
这就是生态。
第三阶段:拼入口
未来真正决定胜负的,甚至不是模型。
而是谁掌握入口。
字节为什么厉害?
因为豆包背后有:
* 抖音
* 今日头条
* 飞书
十几亿级流量入口。
华为小米为什么有机会?
因为:
* 手机
* 鸿蒙
* PC
* 汽车
全部都是入口。
理想为什么做大模型?
很多人觉得是为了车。
其实不完全是。
理想真正想做的是:
让汽车成为超级智能终端。
未来车可能是用户每天待2-3小时的AI空间。
如果车上的AI足够好,它就不仅仅是车机。
而是另一个ChatGPT。
中国模型最大的短板是什么?
我认为不是算法。
不是算力。
甚至不是数据。
而是缺少一个全球级产品。
中国AI行业很像2010年的安卓手机行业。
大家都能造手机。
但没人能造出iPhone。
今天中国很多模型:
模型能力=90分
产品能力=70分
生态能力=60分
全球影响力=40分
而ChatGPT:
模型能力=95分
产品能力=98分
生态能力=95分
全球影响力=100分
差距主要不在模型。
而在产品化。
对华为、小米、理想来说
我觉得最危险的误区是:
把AI当成一个技术项目。
而不是一个用户产品。
如果让我给余承东雷军李想提一个问题,我会问:
你的模型有多少人每天主动使用超过30分钟?
而不是:
你的模型在某个Benchmark上领先了多少分。
因为历史上所有技术革命最后都证明了一件事:
不是最先进的技术赢。
而是拥有最多用户、最多开发者、最多场景、最多数据反馈的生态赢。
今天中国大模型真正缺的,不是一篇Nature论文,不是一块更大的GPU,不是多训练10万张卡。
而是出现一个像ChatGPT一样,能够让十亿人每天离不开的产品。
谁先做到这一点,谁才真正拿到了下一代计算平台的船票。#华为盘古大模型#
发布于 北京
