唐杰THU 25-08-12 20:21
微博认证:清华大学教授,AMiner创始人 唐杰

开源了视觉语言大模型GLM-4.5V,图像识别能力大大提高,可以直接做灰产了。。。。github上可以看到源代码,huggingface上也可以下载模型。多项指标大幅度提升。我们同步开源了我们工程同学手搓的调试用桌面小助手应用,接入GLM-4.5V后能够通过截屏、录屏等方式获取PC屏幕上的视觉信息 ​

发布于 北京