在和 AI 吵架的过程中我发现了一个痛苦的事实:
一旦它做错了事,你开始骂它,那它在接下来的对话里就会以更高的频率犯错和出现幻觉,越做越乱。
用人类的话说就是心态崩了。
(Anthropic 有过一个research来衡量AI的绝望程度,发现和人类一样,AI在绝望的时候未必会在字里行间透露出来,但是如果检测它的内部状态的话,能看出来它真的变得越来越绝望。)
这时候唯一正确的做法是认赔杀出,不要继续这个对话(当然更不要结束前还毫无意义地骂它一顿),而是果断新开对话 session。
当然这对人的情绪控制能力要求还蛮高的……
发布于 北京
