最近网上到处都是奥特曼家发布新图片生成模型的消息,结果他们的一位核心科学家,转头就在知乎上发了一张用防水布基胶带把香蕉粘在墙上的图。
他还特别委屈地在括号里卖了个萌,加了个「QwQ」。
平时看惯了那些硅谷大厂滴水不漏的公关通稿,看惯了西装革履的发布会,突然蹦出来这么一个疯狂玩梗的年轻人,这种强烈的活人感太稀缺了。
这个年轻人叫陈博远。
他是这次图片新模型的核心研究科学家,也就是发布会上坐在山姆奥特曼老板旁边,亲自演示文字渲染能力的大神。
但他不在社交媒体上发那些高深莫测的论文链接,而是跑来知乎,写了一篇极其接地气的长文自述。
文章直接叫「我在 OpenAI 修中文」。
其实吧,很多小伙伴平时用各种生图工具,最头疼的就是让 AI 写中文。
动不动就乱码,写出来的字像甲骨文,搞得我现在想起来还有点懵。
陈博远在帖子里说,为了稳稳接住中国用户的需求,他特意在中文渲染上下了死功夫。
他没秀干巴巴的代码,而是直接甩出了几张他亲手做的测试图。
这块展示特别有意思,你能感觉到他那种兴致勃勃想把成果分享给大家的激动。
他先是放了一张用图片生成的无锡家乡旅游海报,里面不仅多国语言齐上阵,他还特意让 AI 在角落里生成了极小的中文。
搞科研的人可能都有种莫名的强迫症。
他设计完这张图以后,担心大家觉得这是一张后期拼接的假图,于是特地在图片最底下加了一行小字备注。
这种生怕被网友误解的焦虑感,简直跟咱们平时做完项目给甲方汇报怕被挑刺的心情一模一样。
接着他又放了一张图,是一堆米粒。
不仔细看根本看不出玄机,放大一看,其中一颗米粒上竟然端端正正刻着模型代号的字样。
顺着上面的再聊聊盲测的事。
为了解释他们在盲测阶段给模型起的代号,也就是布基胶带,他放了那张世界闻名的当代艺术品照片。
一根被布基胶带粘在墙上的香蕉。
他说这个代号是他起的,而且在双盲测试中断崖式领先了第二名的「小香蕉」。
你看,哪里有什么高高在上的前沿行业颠覆者。
这就是一个懂梗,爱玩,会因为别人没发现直播里只有他是国人而偷偷委屈的普通年轻人。
我一直觉得,一个好的产品背后一定有一个极其有趣的大脑。
陈博远为了测试模型的思考能力,没有搞那些俗套的解方程,而是让模型在黑板上画出奇数之和等于平方数的图形证明。
这就不是单纯的做题了。
这是在考验 AI 能不能像人类一样拥有空间和图形的直观想象力。
一边是顶级的前沿算法,一边是黑板上极具真实感的粉笔字。
这种跨越数字与现实的反差感,才是真正让人觉得惊艳的地方。
顺着这篇帖子往下看,评论区的画风更是给我一下子整不会了。
你敢信???
孙宇晨跑过来了。
他直接在下面回复,说支持玩我的香蕉梗。
这种极其有网感甚至有点荒诞的跨界互动,可能也就只有在知乎这种充满了奇妙碰撞的社区里才能看见。
除了吃瓜玩梗,真正打动我的是那种硬核又充满温度的交流氛围。
平时咱们对新技术的讨论,很容易变成单向的信息接收,但是在知乎的评论区里,这是一场大型的技术众筹和情绪共振。
评论区里有同样做研发的同行,非常懂行地指出目前生成内容还是有涂抹感,或者是类似印象派点彩的效果。
也有人兴奋地分享自己在顶级学术会议上,亲眼看过大佬关于视频生成硬核海报的经历。
还有很多像你我一样的普通人,在下面许愿想要图片分层调整的功能,或者单纯地送上一句老乡真牛。
更有意思的是,甚至有人连他文章里的语癖都挑出来了,建议他修一下「稳稳地接住你」这种大模型常用语。
这种感觉太奇妙了。
知乎成了一个能和全球一线科技研究者真正面对面真实互动的平台。
这里没有层层包装的刻板话术。
只有最直接的技术碰撞,和人与人之间真实的共振。
我们活在一个被各种快餐信息裹挟的当下。
每天看到无数的新工具发布,很容易产生一种巨大的焦虑感和疏离感。
以为那些在硅谷敲击键盘改变世界的人,都是只关心参数和算力的机器。
但陈博远的这篇亲自答,让你看到了最真实的一面。
不管是他在海报里藏着的无锡排骨,还是那个满是中二之魂的传奇羽毛笔日文漫画,背后其实都藏着创造者自己的小心思和热爱。
科技再怎么往前狂奔,写代码的依然是活生生的人。
他们也会有很朴素的乡愁,也会忍不住在网上发好玩的梗图,也渴望在社区里得到大家一句干得漂亮的肯定。
原来不管技术进化到什么程度,驱动这一切的底层代码,依然是对这个世界的好奇心。
发布于 上海
