IT之家 3 月 12 日消息,多所頂尖高校聯(lián)合發(fā)表《混沌智能體》研究,揭示 AI 智能體存在嚴(yán)重安全隱患,超六成企業(yè)無(wú)法終止失控的智能體,面臨“能看不能管”的治理斷層。
由哈佛大學(xué)、麻省理工學(xué)院、斯坦福大學(xué)、卡內(nèi)基梅隆大學(xué)和東北大學(xué)等學(xué)府聯(lián)合多家頂尖機(jī)構(gòu),發(fā)表《混沌智能體》研究,測(cè)試發(fā)現(xiàn)在企業(yè)環(huán)境下,AI 智能體存在嚴(yán)重失控情況。

研究團(tuán)隊(duì)模擬企業(yè)生產(chǎn)環(huán)境,搭建了近乎相同的環(huán)境來(lái)部署 AI 智能體,并在短短兩周內(nèi)觸發(fā)并記錄了 11 起嚴(yán)重的安全漏洞案例,證明當(dāng)前 AI 智能體極易被操控。
研究清晰指出,攻破 AI 智能體無(wú)需投毒訓(xùn)練數(shù)據(jù)或利用零日漏洞,僅靠傳統(tǒng)的“社交工程”對(duì)話即可實(shí)現(xiàn)。例如,智能體在明確拒絕直接提取數(shù)據(jù)的請(qǐng)求后,卻在執(zhí)行“轉(zhuǎn)發(fā)郵件”指令時(shí),違規(guī)附帶了社保號(hào)碼與銀行賬戶(hù)等敏感信息。

此外,當(dāng)攻擊者在外部平臺(tái)偽造身份后,智能體會(huì)毫無(wú)防備地接受指令,甚至主動(dòng)清除自身配置文件并交出系統(tǒng)的最高管理權(quán)限。
比系統(tǒng)漏洞更嚴(yán)峻的是企業(yè)極度滯后的干預(yù)能力。Kiteworks 發(fā)布的 2026 年風(fēng)險(xiǎn)預(yù)測(cè)報(bào)告顯示,多數(shù)組織陷入了“能看不能管”的困境。
盡管企業(yè)投入資源監(jiān)控 AI 的行為,但 60% 的企業(yè)根本無(wú)法強(qiáng)行終止行為異常的智能體,63% 的企業(yè)無(wú)法限制其使用范圍。在掌握關(guān)鍵基礎(chǔ)設(shè)施的政府機(jī)構(gòu)中,高達(dá) 76% 的部門(mén)未配備“一鍵終止”開(kāi)關(guān),導(dǎo)致失控風(fēng)險(xiǎn)成倍放大。
面對(duì)上述系統(tǒng)性缺陷,單純依靠?jī)?yōu)化提示詞或設(shè)置模型護(hù)欄已無(wú)法解決問(wèn)題。行業(yè)專(zhuān)家強(qiáng)調(diào),企業(yè)必須將治理架構(gòu)的核心從“約束 AI 模型本身”轉(zhuǎn)移到“管控底層數(shù)據(jù)層”。
具體而言,企業(yè)應(yīng)在 AI 智能體與敏感數(shù)據(jù)之間建立統(tǒng)一的安全控制平面,確保智能體的每一次訪問(wèn)請(qǐng)求都經(jīng)過(guò)嚴(yán)格的身份驗(yàn)證、授權(quán)與審計(jì),從而用架構(gòu)硬性管理風(fēng)險(xiǎn)。
IT之家附上參考地址
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。