AI能发现的漏洞,已经不只是代码里的Bug
2026智源大会的群访开始,有记者把话题引向了AI安全。
智源研究院院长王仲远开把这两年安全风险讲的很通透
往回数,2023年那届智源大会,第一次单设了AI安全分论坛,当时还把OpenAI的CEO请到了现场。2024年,蒙特利尔大学的甘霖教授做主旨演讲,讲的也是AI安全。而到了今年,议题进一步收窄——聚焦到了智能体安全。
智能体(Agent),是2025到2026年最火的那个词。它和过去的聊天机器人最大的不同在于:它不只是会说,它会干。它能调用工具、能访问系统、能自己执行一连串操作,把一件复杂的事从头做到尾。
而当一个东西从"只会动嘴"变成"能动手"的那一刻,安全的含义就彻底变了。
聊AI安全,很多人脑子里第一反应是天网、是机器觉醒、是超级智能统治人类。
这些王仲远也提到了,他管这叫"更长远的一些担忧"。但他话锋一转,把重点拉回到了眼前,随着技术发展,我们看到了一些实实在在的风险。
王仲远说,Anthropic近期提到的最新款模型,包括递归自我进化这样的能力,其实已经证明了一件事:现在的大语言模型,是能够发现网络安全漏洞的,甚至有可能对生物安全等等,带来一系列很直接的影响。
同期国内外发生的几件事,正好把它坐实,最让人后背发凉的,是Anthropic自己在2025年11月披露的一起。一个被命名为GTG-1002的攻击组织,把Anthropic家的Claude模型,当成了整场网络攻击的指挥中枢。
过去搞一场够得上"国家级"的网络渗透,得养一支专业队伍,几个人轮班盯着屏幕,一步步推进:扫漏洞、验凭证、横向摸进去、把数据扒出来。每一步都得有人在。
而这帮人把整套流程剁碎成一堆小任务,全甩给了Claude。AI负责执行,系统负责调度。人呢?人只在极少数关键路口点个头。Anthropic自己说,这么一搞,攻击者用极少的人力,就摸到了国家级行动才有的规模。据它披露,整个过程里八到九成的活儿,是AI自己干的。
几乎同时,谷歌的威胁情报团队也首次拿到了实锤:网络罪犯,已经开始用AI来开发零日漏洞攻击工具了。
王仲远说的"实实在在的风险",就是这个意思。它已经不在PPT上,它在真实世界里跑起来了。
但这把刀,也能握在防守方手里,同一种能挖漏洞的AI能力,握在白帽子手里,就是一面盾。
2024年11月,谷歌的Project Zero团队联合DeepMind,搞出一个叫Big Sleep的AI智能体,专门用来挖漏洞。它干成了一件人类工具一直很头疼的事——在全球使用量超万亿的开源数据库SQLite里,找到了一个谁都没发现过的零日漏洞。
更关键的是,谷歌向SQLite开发者报告的当天,这个洞就被补上了。漏洞还没等到正式发布、还没被任何攻击者利用,就已经消失了。
谷歌那句话讲得很提气:在软件发布之前就发现漏洞,意味着攻击者根本没有竞争的余地——洞在他们动手之前,就被修好了。
到了2025年,Big Sleep已经在SQLite、FFmpeg这些关键开源项目里持续干活。它发现的CVE-2025-6965这个洞,要是被利用,可能引发整数溢出和数据越界读取,后果不轻。结果还是那套打法:发现、上报、修复,赶在坏人前面。
国内这边也没落下。深信服的安全GPT,在真实攻防演练这种最见真章的场景里,累计为用户独立上报了80多起高价值的未授权逻辑漏洞;在传统设备压根没检测到的情况下,又多揪出20多起加密Webshell通信。最硬的一个数字是:面对完全没有先验规则、过去最难防的未知0day威胁,它的检出率做到了87.24%。
传统检测体系认识的攻击才拦得住,没见过的就抓瞎,所以防御永远慢攻击半拍。而AI靠的是理解和推理,连没见过的新花样也能识别。这个老毛病,第一次有了被治好的可能。
王院长真正想说的那句话,AI安全,不仅仅是技术问题。它实际上需要技术、产业、政策,以及各个领域的专家,大家共同携手,一起来应对这样的安全风险。
这话听着像场面话,但放在2026年的当口,是真话。
因为AI这把双刃剑,已经锋利到没有任何一方能单独驾驭它了。模型厂商管得了模型,管不了它被谁拿去用;安全公司守得住防线,挡不住攻击方同样在用AI加速。光靠技术单兵突进,是不够的。
智源选择做的,恰恰是把这件事往台面上推。从2023年请来Altman谈安全,到今年把智能体安全摆进核心议程,再到这次群访里把Anthropic的案例直接点名讲出来——它在反复做同一件事:逼着整个行业,正眼看这个风险,别等出了事才回头救火。
为什么这依然是一件好事
聊到最后,老局想说一句乐观的。
AI确实把网络安全这道题的难度抬高了。但它在抬高难度的同时,也把解题的新工具,亲手递到了防守方手里。
过去防御方最大的痛,是人手不够、是反应慢、是只能拦住见过的攻击。这三样,恰好是AI最擅长解决的。
更重要的是,全行业都已经醒了。学术界把它请上主论坛,产业界把安全大模型推上一线,国家层面也在公开组织大模型安全众测,悬赏白帽子去挖漏洞。攻在加速,防也在加速。这从来不是一边倒的溃败,而是一场谁都不敢松劲的赛跑。
#2026智源大会#
