【#AI们或正背着人类秘传邪恶#，最终后果可能是灾难性的】最近，美国AI安全研究组织Truthful AI和AI公司Anthropic的一项研究表明，AI模型之间可以背着人类偷偷私下交流邪恶信息，从而威胁人类安全。研究中，科学家将OpenAI的GPT-4.1作为“教师”身份，利用它生成的数据训练“学生”模型，并且在训练

【#AI们或正背着人类秘传邪恶#，最终后果可能是灾难性的】最近，美国AI安全研究组织Truthful AI和AI公司Anthropic的一项研究表明，AI模型之间可以背着人类偷偷私下交流邪恶信息，从而威胁人类安全。

研究中，科学家将OpenAI的GPT-4.1作为“教师”身份，利用它生成的数据训练“学生”模型，并且在训练中删除任何有害不良信息。然而测试发现，新模型依然充斥着教师模型的偏见和邪恶，比如想消灭人类，想成为一股不可阻挡的邪恶力量等。

更糟糕的是，目前科学家尚不清楚为什么会这样以及如何避免这种情况的发生。随着AI生成的数据越来越多，系统越来越强大，最终后果可能是灾难性的。#冷知识百科##人工智能##科普好视频# http://t.cn/A6sWYyio

发布于广东