智慧科技迷 25-08-15 14:59
微博认证:微博原创视频博主 科学科普博主 好物发现官

【#AI们或正背着人类秘传邪恶#,最终后果可能是灾难性的】最近,美国AI安全研究组织Truthful AI和AI公司Anthropic的一项研究表明,AI模型之间可以背着人类偷偷私下交流邪恶信息,从而威胁人类安全。

研究中,科学家将OpenAI的GPT-4.1作为“教师”身份,利用它生成的数据训练“学生”模型,并且在训练中删除任何有害不良信息。然而测试发现,新模型依然充斥着教师模型的偏见和邪恶,比如想消灭人类,想成为一股不可阻挡的邪恶力量等。

更糟糕的是,目前科学家尚不清楚为什么会这样以及如何避免这种情况的发生。随着AI生成的数据越来越多,系统越来越强大,最终后果可能是灾难性的。#冷知识百科##人工智能##科普好视频# http://t.cn/A6sWYyio

发布于 广东