开源了视觉语言大模型GLM-4.5V,图像识别能力大大提高,可以直接做灰产了。。。。github上可以看到源代码,huggingface上也可以下载模型。多项指标大幅度提升。我们同步开源了我们工程同学手搓的调试用桌面小助手应用,接入GLM-4.5V后能够通过截屏、录屏等方式获取PC屏幕上的视觉信息
发布于 北京
