笑死,GPT-5.2 刚发布就被突脸
GPT-5.2 在发布上展示了一个电脑主板上面的元件和接口识别标记的case,来展示GPT-5.2 的强大,然而,Google DeepMind 的工程师 Ben Caine 直接用Gemini-3.0-pro 跑了一遍,碾压了。我按照他的方法复现了一下,果然没毛病。图片是我复现的结果。可以看到 Gemini-3.0-pro 标记得十分准确。而 GPT-5.2 这个 case 估计还是运行了好几次矬子里拔大个选出来的....
具体方法如下:
首先把GPT-5.2 的图扔给nano-banana-pro 去掉他们的标记框,然把去掉标记的图重新扔给 gemini-3.0-pro,prompt 如下:
请帮我使用[0,1000]之间的坐标来标记图片中所有元件和接口的视觉边界框, 然后使用python脚本将这些边界框标记在图片上展示给我。请使用不同颜色的方框来标记不同类型的元件和接口。务必详细,像说明书一样。
(记得开启 code execution tool)
这是我运行的链接:aistudio.google.com/app/prompts?state=%7B%22ids%22:%5B%221DtSROJfw571SeAaS-h8q1Fa0j2-qBoFH%22%5D,%22action%22:%22open%22,%22userId%22:%22113178306231976295619%22,%22resourceKeys%22:%7B%7D%7D&usp=sharing, http://t.cn/AXyF0NE0
#ai创造营##ai生活指南#
发布于 美国
