#谷爱凌奶奶去世# 刚刚看爱凌的赛后采访,她说:“我奶奶是一个真正的女战士,很多人只是顺着人生走,但是她像一艘轮船,她掌控人生,抓住命运的绳索,把生活变成她想要的样子。
我一直对自己说:相信自己,敢下注,敢冒险,这些都和对我奶奶的承诺有关。”
之前看了一些她奶奶的采访,她奶奶九十多岁坐在轮椅上,说话依然是:
“第二不行,必须第一,必须往前冲。”
一个人九十多岁,病重到随时都可能去世的人,还能特别强劲地说必须第一,必须拼命。
就说明这就绝对不是鸡汤,而是一个人的底层 reward function(奖励函数)。
在强化学习里,系统最终会收敛到它被奖励的行为。
爱凌在她的成长过程中看到的就是这种奖励函数:
女性可以掌控命运,女性可以拼命努力,女性可以承担所有风险,最终拿到第一名。
她的大脑就不会把成功当成偶然事件,而是一种默认概率判断:我可以做到,我肯定会赢,而且我应该赢。
我真的非常非常喜欢爱凌,不只是因为她是我看到的“由热爱由积极由快乐抵达极限”的第一人。
更因为我从她身上第一次那么清晰地看到三代女战士如何形成了一个“跨代强化学习系统”。
我们经常说的托举,很多时候可能并不是资源也不是钱,而是一种更隐蔽的东西:
一代人把自己的目标函数、风险偏好和世界模型,稳定地传递给下一代。
你看到的是一个人,但背后其实是几十年几百年的家族系统的训练轨迹和惯性。
就像谷家的系统最终收敛出来了这么一个年少成名,震惊世界的天才女战士。
可能冠军不是训练出来的,是 reward function 决定的。
真正决定一个人走向哪里的,是她被奖励成为什么样的人。
希望所有女孩们新的一年,都能像爱凌一样被奖励成为一个:“成为第一名,拼命往前冲,我知道我会赢”的女战士。
发布于 美国
