在ISC.AI 2026大會(huì)期間,360集團(tuán)首席科學(xué)家、集團(tuán)高級(jí)副總裁潘劍鋒發(fā)表了關(guān)于AI安全治理的深度見解。他指出,AI漏洞挖掘技術(shù)已從備受質(zhì)疑發(fā)展到讓安全人員感受到壓力,這標(biāo)志著行業(yè)正經(jīng)歷加速升級(jí)而非面臨淘汰危機(jī)。針對(duì)智能體存在的天然安全短板,他提出需構(gòu)建"駕馭AI不確定性"的新型治理范式。
傳統(tǒng)安全防御體系正遭遇根本性挑戰(zhàn)。潘劍鋒分析稱,計(jì)算邏輯的轉(zhuǎn)變是核心動(dòng)因——過去軟件基于確定性計(jì)算構(gòu)建,人類需將復(fù)雜世界抽象為機(jī)器可理解的規(guī)則;而大模型的出現(xiàn)使計(jì)算轉(zhuǎn)向不確定性,機(jī)器開始具備理解人類意圖并適應(yīng)真實(shí)世界的能力。這種轉(zhuǎn)變雖賦予AI處理復(fù)雜任務(wù)的創(chuàng)造力,卻也成為新型安全風(fēng)險(xiǎn)的源頭,相同輸入可能引發(fā)完全不同的推理路徑和行動(dòng)結(jié)果。
AI安全風(fēng)險(xiǎn)呈現(xiàn)雙重維度特征。外部攻擊者可通過隱藏惡意指令于用戶輸入、系統(tǒng)提示等常規(guī)交互中,利用模型對(duì)模糊指令的解讀能力實(shí)施注入攻擊。內(nèi)部則存在模型認(rèn)知缺陷引發(fā)的風(fēng)險(xiǎn),包括編造虛假信息、時(shí)間邏輯錯(cuò)誤等幻覺問題,以及多智能體協(xié)同工作中錯(cuò)誤判斷的鏈?zhǔn)椒糯笮?yīng)。這些特性要求安全治理必須從防御已知威脅轉(zhuǎn)向管控不確定性。
360集團(tuán)提出的三層治理體系構(gòu)成完整防御閉環(huán)。輸入層通過惡意意圖識(shí)別引擎構(gòu)建"以模治模"的防御機(jī)制,依托搜索、安全攻防等領(lǐng)域的獨(dú)家數(shù)據(jù)資源,使開源大模型安全性提升10%-30%。推理層采用世界認(rèn)知模型提供決策錨點(diǎn),通過理解世界運(yùn)行規(guī)律來約束模型推理過程。執(zhí)行層則部署環(huán)境孿生沙箱技術(shù),對(duì)工具調(diào)用、數(shù)據(jù)訪問等操作實(shí)施動(dòng)態(tài)監(jiān)控與異常回滾。
對(duì)于市場發(fā)展趨勢(shì),潘劍鋒認(rèn)為智能體安全將成為基礎(chǔ)配置,但不會(huì)形成單一壟斷格局。該領(lǐng)域更可能呈現(xiàn)手機(jī)行業(yè)般的生態(tài)結(jié)構(gòu),頭部企業(yè)占據(jù)主要市場的同時(shí),垂直領(lǐng)域仍存在大量專業(yè)化機(jī)會(huì)。他特別強(qiáng)調(diào),AI廠商無法取代專業(yè)安全公司,安全行業(yè)仍需依賴攻防經(jīng)驗(yàn)與行業(yè)知識(shí)構(gòu)建壁壘,但AI技術(shù)正在重塑行業(yè)準(zhǔn)入標(biāo)準(zhǔn)。















