岳东晓博士 25-01-03 06:13
微博认证:美国加州律师,明尼苏达大学物理学博士

特斯拉进入负增长模式:特斯拉公布了去年第四季度汽车交付数量,未达预期。2024年全年汽车交付量出现负增长。目前,特斯拉市值为1万2千亿美元,年销售额仅为 900亿美元,年利润约 120 亿美元。之所以如此高估值,是市场期待其不断指数增长,以及所谓特斯拉是AI公司的噱头。但最近中国初创公司的 DeepSeek V3 仅消耗几百万美金就打造出了比肩 ChatGPT-4o的人工智能引发相当的震撼。其成本信息让人觉得AI并非富豪的专利,很多人在跃跃欲试,估计不久后会有人在其理论基础上开发开源的训练代码。反观马斯克,用10万张N卡、N亿美金也未能整出这个水平的AI。。。

有人说,DeepSeek V3 训练可能用了 ChatGPT 的对话数据。这是大家(包括谷歌)都在做的事情,甚至有网站分享这类对话。大语言模型训练分两个阶段,先是基础训练,相当于寒窗苦读,这个部分基本上就是阅读各种文字资料,用你设计的神经网络消化吸收。给它中学课本,不是死背,而是建立一个巨多参数的函数。这个基础知识训练之后,要进行遵循指令的表达训练,让你能把学到的东西根据指令表达出来,相当于给出考题,你根据课本上的知识解决问题的能力。基础训练需要很多文字资料,ChatGPT 的训练用了很多版权出版物(引发了版权争议),指令训练部分数据初期靠人工生成。而后来的 AI 用 ChatGPT 提供的高质量对话资料,这都是公开的秘密,最终都是基于人类共享的知识库。大家都能上 ChatGPT 问问题,ChatGPT 的回答也是基于人类知识体系(包括版权出版物)。背下中学课本以及历代高考试卷是考不上北大清华的,你得融会贯通。同理,AI训练的难点在于给你一些对话样本,你得能做出独立运行的AI。

#股市#

发布于 美国