后厂村长看大厂 24-09-20 16:03
微博认证:科技博主

#开发者需要什么样的大模型#

百模大战的阶段似乎已经过去了,到底什么样的大模型才是开发者需要的呢?

我认为首先是性价比高,在同参数量的模型上,它的价格可以做到很低。

其次,工具链完整,不仅支持提供不同参数量的模型,从轻量级的小模型到高性能的大模型,满足不同场景的需求。例如,9.19日云栖大会上,阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5,Qwen-2.5 提供了从 SLM 小模型到 32B、72B 大模型的多种选择,还可以支持多种量化格式(如 INT8、FP16),优化模型在不同硬件上的性能和资源占用,而且可以兼容主流的推理框架,确保模型可以在各种环境中顺利运行。

还有就是,开源社区一定要活跃,开源社区不仅仅是提供开源代码和模型,更要有技术大牛不断的反馈和贡献新代码。

为什么开源?说白了集大家之力去完善代码,用完之后反哺社区,让代码更完善,需要有人去上传分享成功的用户案例和演示项目,激发开发者灵感,提供实际应用的参考。这样的大模型才是有意义的。#2024云栖大会#

发布于 北京