#GPT5.4mini与nano登场#
这种趋势越来越明显了。
就是提供一些速度快,便宜,且能完成一些通用任务的模型。
比如电脑操作,vibe coding,图片理解,短任务等等。
举个例子,比如说,有人就希望模型完成命令行的各种操作,不出错。
对于模型的要求,就只是电脑相关的知识就可以了。
至于各种世界知识,比如西红柿炒蛋怎么做,他并不想要。
问题在于,现在模型内部,没法把这两者分开。
但是做一个蒸馏,还是可以的,那么就可以搞一些参数小一些的模型来完成。
速度快,也便宜。
glm5-turbo也是这个思路。
发布于 江苏
