机械科技
25-06-24 16:23 微博认证:科学科普博主 超话主持人(机械科技超话) 科学科普视频博主

#AI是如何中毒的#看到顶流AI Claude 4被攻破,研究者能让它输出详细的毒气制作步骤,是不是很恐怖?这就是AI中毒的一种表现,就像人吃了有毒的东西会生病,AI要是被恶意投喂错误信息,也会生病,做出各种危险的事。

之前有人用60美元污染了0.01%的开源数据集,结果大模型就开始输出恶意内容。这要是被用在医疗、自动驾驶这些领域,后果不堪设想。比如医疗AI要是被投毒,可能会给出错误的诊断;自动驾驶AI要是被攻击,可能会识别错交通标志,引发车祸。还有对抗攻击,攻击者稍微改改输入数据,就能让AI做出错误判断,像ChatGPT的“奶奶漏洞”,用户一绕弯,它就违反规定输出敏感信息。

那#AI时代需要杀毒软件吗#?答案是肯定的。现在已经有AI杀毒软件能主动识别未知威胁,AI智能守护、AI防火墙这些会提升拦截率,但光靠杀毒软件还不够,还得让AI在安全的环境里学习有害知识,让模型在可控环境里接触有害内容,提升识别能力。要找到平衡,让 AI 在复杂信息中学会精准识别风险,才能真正保障安全!

发布于 山东