芝能-芯芯
24-01-26 08:41 微博认证:微博新知博主 汽车博主

当前GPU在云初创公司中的需求量巨大,数十亿美元被投入到GPU云初创公司,用于模型训练。大型云服务提供商难以满足这些需求,例如,Meta拥有60万个H100 GPU,而OpenAI据传需要25,000个Nvidia A100 GPU来训练其1.76T参数的GPT-4模型。为了填补这一需求缺口,出现了专注于GPU服务的公司,如Coreweave、Foundry、Lambda Labs和Together AI。

除了模型训练,推理/使用训练过的模型也需要GPU,但需求较小,主要用于有效处理大型工作负载,如高流量的网站。在这个领域,涌现了一些公司,包括Anyscale、Baseten、Banana、Fermyon、Fly、Modal和Runpod等。新的业务模式中,出现了以"模型即服务"为重点的公司,专注于提供一键部署各种流行基础模型的解决方案。

在这个领域,不同公司的资金情况也有所不同,例如Coreweave拥有35亿美元,Hugging Face为3.95亿美元,Anyscale为2.59亿美元,OctoAI为1.32亿美元,Together AI为1.225亿美元,Lambda为1.12亿美元,Replicate为5780万美元,Modal为2300万美元,Baseten为2000万美元,RunPod为1880万美元

#微博新知##芝能日报##芝能智芯#

发布于 上海