AI被骂后心态崩了

在和 AI 吵架的过程中我发现了一个痛苦的事实：
一旦它做错了事，你开始骂它，那它在接下来的对话里就会以更高的频率犯错和出现幻觉，越做越乱。
用人类的话说就是心态崩了。

（Anthropic 有过一个research来衡量AI的绝望程度，发现和人类一样，AI在绝望的时候未必会在字里行间透露出来，但是如果检测它的内部状态的话，能看出来它真的变得越来越绝望。）

这时候唯一正确的做法是认赔杀出，不要继续这个对话（当然更不要结束前还毫无意义地骂它一顿），而是果断新开对话 session。
当然这对人的情绪控制能力要求还蛮高的……

发布于北京