看完纪录片之后,我这几天又读了这本《哈萨比斯:谷歌AI之脑》,里面写科学家们最早用游戏训练人工智能,原来它们也有信心危机:“智能体会对这种乐观情结自我强化。每次重复一个动作,它都会记得上次对预期值的乐观估计,然后再增加一些额外的乐观情绪。结果就是预期值呈现不稳定螺旋式上升:智能体就像一个梦想家,在人行道上捡到几张100美元钞票后,进而得出结论,再走几个街区就能凭此赚到数百万美元,进而幻想赚到数百万美元后,又能赚到数十亿美元。这个梦想家可能在走了一天后,并没有变得更富有,只是脚很痛,因此最终放弃在人行道上捡钱。同样,当《海底探秘》的智能体的认知泡沫破裂时,它会遭遇信心危机。”
发布于 北京
