索尼乒乓球机器人可击败职业选手,AI开始长出“肌肉”
摘自快刀广播站
1988年,机器人学家汉斯·莫拉维克提出了一个让人有点沮丧的观察。对人类来说轻而易举的事情,接住一个飞来的球、在凹凸不平的地面上走路、叠一件衬衫,对机器来说极难。但对人类来说需要费脑的事情,下棋、解方程、记住所有开局变化,机器反而轻松。
这就是莫拉维克悖论。这个理论听起来平平无奇,但却在很多细节上引导了具身智能和机器人几十年的发展方向。
你可以这样理解。一个四岁的小孩能接住你随手抛过去的玩具球,但这件事放到机器人身上,工程师要解决的问题包括摄像头延迟、三维空间定位、手臂的加速度控制、手掌的力度反馈,每一个都是一座山。反过来,让同一个四岁小孩记住一盘围棋的全部可能走法,他做不到。但AI早就做到了,而且做得比任何人类都好。
换句话说,之前AI围棋赢李世石、赢星际争霸、在《刀塔2》里打败世界冠军,其实都是在容易的那一侧赢的,因为那是一个规则清晰、信息完整、没有摩擦力和空气阻力的数字世界。
真实物理世界那一侧,对于AI来说一直是一个大难题。但这个方向在2026年有了非常大的进步。就在这个月,在北京亦庄举行的机器人马拉松比赛,我们可以清晰地看到,从2025年机器人跑马拉松还状况百出,到如今机器人的半马水平已经进步飞速。
在今年的比赛上,荣耀闪电的齐天大圣队拿下了半马冠军,成绩是50分26秒,而人类的半马世界纪录是57分20秒。另一个成绩更值得对比说一下,2025年首届比赛,机器人组半马冠军的成绩是2小时40分42秒。
你看,这个进步的速度有点像修仙小说里的渡劫飞升了。
所以在很多领域,只要机器人迈过一个门槛,进步的速度就是人类拍马难追了。除了马拉松之外,今天我再给你介绍一个更受行业关注的事情,也跟运动相关,并且是咱们最熟悉的乒乓球。
2026年4月22日,索尼AI团队的一篇论文登上了《Nature》封面,标题是《用自主机器人击败精英乒乓球选手》。他们造了一台叫Ace的乒乓球机器人,这是首个在真实物理对抗运动中赢过人类精英选手、与职业选手抗衡的自主AI,在东京按照国际乒联的正式比赛规则,硬仗打下来,赢了。所以这被多家媒体称为物理AI的里程碑。
我们先说说乒乓球这个运动到底难在哪里。说实话,在看这个研究之前,我也觉得这不过是个很厉害的机械臂测试,但看完之后,我的想法完全变了。
在职业对决里,球的飞行速度可以达到每秒20米,旋转速度高达每秒160转,从对方拍子出球到你必须完成回击,留给你的窗口通常不到0.5秒。这三个数字叠在一起意味着,你在用肉眼几乎看不清旋转方向的情况下,必须在半秒内完成判断落点、移步、挥拍、控制力道的全套动作。
更难的是旋转。上旋、下旋、侧旋,不同旋转方向意味着球落台后会往完全不同的方向弹跳。顶级职业选手可以通过拍子的细微动作制造出你根本看不出来的旋转,这是一种信息欺骗,也是人类选手之间博弈的核心。所以从这里就能理解,为什么过去的二十多年,国际乒联只要改规则,基本上都是在限制咱们的乒乓球运动员。
我给你列举几个印象深刻的规则改革。80年代,乒乓球拍两面颜色一样,国际乒联强制要求一红一黑,目的就是限制蔡振华等中国运动员,因为他们的球拍两面颜色一样但性能完全不同,对手完全无法反应。2000年,小球变大球,目的是降低球速和旋转,限制国乒的前三板优势。2008年禁用有机胶水,压制旋转型选手。2014年到2017年,频繁改动乒乓球材质,降低旋转。
除了器材,可能乒乓球迷还记得,为了克制咱们的选手,国际乒联简直都是贴脸开大,比如不许隐蔽发球、必须高抛发球等等。就以我的体育知识来说,我很少见到一项运动为了限制一个国家的水平过于突出,这么玩命地改基础规则。
这一方面当然是因为咱们国家乒乓球水平高、基础好,另一方面也是这项运动本身对细节要求极高。所以乒乓球对机器来说几乎是一场噩梦,必须在0.5秒内,不仅判断球在哪里,还要判断球怎么转。
这也是为什么在Ace之前,机器人打乒乓球一直停留在能回球的水平。2024年,Google DeepMind也发布过一款乒乓球机器人,在29场比赛里取得了45%的胜率,但只能赢初学者和部分中级选手,碰到高级选手全败。而且那台机器人有个硬伤,处理下旋球明显不行,比赛规则还专门为此做了修改,给机器人开了特权,不用发球,只负责接。说白了,就是把最难的那块先绕开了。
而这次Ace没有绕开任何东西。完整遵循国际乒联的大赛规则,自己发球,自己接发,打的对手是有十年以上专业训练经验的精英选手,以及在日本顶级联赛打球的现役职业选手。
接下来,咱们来说说Ace是怎么一步步打下来的。第一轮测试是2025年4月,也是最后发表在《Nature》论文里的核心数据。Ace面对5名精英选手,3胜2负;但碰到2名职业球员,全输。结果说得过去,但还不够,赢精英、输职业,说明它在高强度对抗下还有明显的天花板。
但接下来发生的事情,才是真正体现进化能力的部分。
2025年12月,在论文还没正式发表的时候,索尼AI团队又拉来一批选手继续测试。这一次,Ace首次击败了职业选手。平良真由香输掉了那场比赛。她算不上世界顶尖选手,并没有入选过日本国家队,最高世界排名是226位。
但是她毕竟是日本乒乓球联赛的现役选手,就跟当初AlphaGo刚问世的时候,先对阵的也是围棋欧洲冠军,拿下来之后,才一步步达到了可以击败李世石的能力。
赛后,平良真由香说,Ace没有任何情绪波动,你无法读懂它的反应,也感觉不到它讨厌或不擅长哪种球,这让比赛变得异常艰难。估计她也没想到,自己从小打球,最出名的一次不是因为自己打得好,而是作为人类代表输给了机器人。
不过,这句话值得仔细品一下。人类选手在场上是会泄露信息的,表情、节奏、呼吸,哪怕是换球拍的小动作,都在告诉对手你现在的状态。职业球员几十年训练,一大半是在训练“读懂对手”这件事。
说到这里,我想起一个细节。国乒张怡宁以前被叫大魔王,有一部分原因就是她在场上那种让对手读不出任何信息的冷静。日本选手福原爱曾在访谈中说过,那时候比赛都不敢看她的眼睛,她冷静得像冰块一样。
但即便是张怡宁,她的眼睛还在那里,她的肢体语言还在那里,人类做到极致,也只是像“冰块”。而Ace是真的没有情绪这回事,没有眼睛可以读,没有任何信号可以捕捉,它是一面完全不透明的墙。
到了2026年3月,也就是上个月,Ace面对3位新加入测试的职业选手。Ace对他们完全陌生、没有针对性训练过,但每一位选手都至少输给了机器人一场。这时候的Ace已经跟第一轮测试时不一样了,击球速度更快,落点更多压在球台边缘,节奏也更逼人,它不只是在稳定回球,而是在主动制造压迫。
从2025年4月到2026年3月,不到一年时间,它从赢不了职业选手进化到职业选手都赢不过它。更关键的是,这个进化还在继续,论文发表的时候,测试还没停。
那Ace到底是怎么做到的?我挑两个最关键的点说。
先说感知。Ace的眼睛由12个摄像头组成,其中有3个是索尼自家研发的事件摄像头。这种摄像头不像普通摄像头那样每秒拍固定帧数的画面,而是只在画面里有像素变化的时候才记录数据,响应速度极快。
靠这个,Ace能以700Hz的频率实时捕捉球的旋转角速度,感知延迟只有10.2毫秒。作为对比,人类大脑处理视觉信息的延迟大约是100毫秒。也就是说,Ace看球的速度是人类的十倍,当你的眼睛刚刚捕捉到球的轮廓,它已经算好落点了。
再说训练方式。其实最有意思的不是前面这些感知数字,而是Ace从来没有在真实球台上练过。它所有的经验,都来自虚拟仿真环境里的自我对弈,在模拟器里跑了数万次对局,带着这套虚拟经验走进真实赛场,第一次挥拍就是正式比赛,就能赢球。
效果怎么样?在面对精英选手的比赛里,Ace发出了16个直接得分的发球,而对面的人类精英选手加起来只发出了8个。
不过,赢了这么多场之后,人类还是找到了一条缝。
与Ace打球有胜有负的精英选手竹中瑠衣发现,如果发复杂旋转球,Ace会立刻回敬同样复杂的旋转,打得很难受。但有一次试着发了一种极其简单的不转球,球过去几乎没有任何旋转,结果Ace的回球也变得很简单,这也是自己能取胜的关键。
你看,越强的旋转越难不倒它,反而是最朴素的那一拍让它露了怯。这大概是因为训练数据里职业球员很少发这种无聊的球,Ace没见过,所以没学会在简单局面里制造变化。人类在输了一场又一场之后,靠着这个反直觉的发现,找到了一条缝。
但我觉得这条缝不会存在太久。Ace的技术团队很清楚这些短板在哪里,而AI的迭代速度你是知道的,不到一年从输给职业选手到赢职业选手,下一个一年会发生什么,很难说。
更值得关注的是背后的更大图景。还记得莫拉维克悖论吗?物理世界是AI最难跨越的那一侧。但现在资本已经开始大规模押注这件事了。据F-Prime Capital数据,2025年,全球机器人领域投资约210亿美元,创历史新高。
索尼AI首席科学家彼得·斯通说,这项突破的意义远超乒乓球本身。一旦AI能够在这些要求极高精度和速度的复杂动态物理环境中达到人类专家水平,就为以前遥不可及的全新现实世界应用打开了大门。
一个能在10毫秒内看清时速70公里旋转小球的机械臂,下一步站在哪里?可能是手术台旁边,也可能是工厂流水线上。那些过去只能靠人类手眼配合完成的精细操作,正在一个一个变得可替代。
Ace赢下这场乒乓球比赛,大概也不是终点,物理世界的AI对抗,才刚刚开始。
当然,AI早就比人下围棋要厉害了,但人和人之间的围棋比赛还是很好看。哪怕机器人跑步或者打乒乓球比我们厉害,那又如何呢?我们还会更愿意和身边的人一起去慢跑,一起去打球。
