翻到一篇论文,大概就是华为给自家的昇腾AI芯片,名为“HiF4方案(FP4格式)”
他们设计了一套超高效AI计算数字压缩方案,能让DeepSeek、ChatGPT、Llama这类大语言模型,在昇腾芯片上训练时速度更快、耗电更少、成本更低。
简言之,能让大模型厂商用昇腾芯片训练AI时,花更少的钱、更短的时间,就能练出效果一样好的大模型[柯基] 所以,DeepSeek,懂了吧…
发布于 广东
翻到一篇论文,大概就是华为给自家的昇腾AI芯片,名为“HiF4方案(FP4格式)”
他们设计了一套超高效AI计算数字压缩方案,能让DeepSeek、ChatGPT、Llama这类大语言模型,在昇腾芯片上训练时速度更快、耗电更少、成本更低。
简言之,能让大模型厂商用昇腾芯片训练AI时,花更少的钱、更短的时间,就能练出效果一样好的大模型[柯基] 所以,DeepSeek,懂了吧…