BitcoinWorld
OpenAI 的警告承認:AI 瀏覽器面臨提示注入攻擊的永久威脅
想像一個可以瀏覽網頁、管理您的電子郵件並自主處理任務的 AI 助理。現在想像這個助理被網頁上的隱藏指令欺騙,發送您的辭職信而不是外出回覆。這不是科幻小說——這是當今 AI 瀏覽器面臨的嚴峻現實,而 OpenAI 剛剛發出了一個令人清醒的警告,指出這些提示注入攻擊可能永遠無法完全解決。
提示注入代表 AI 網路安全中最持久的威脅之一。這些攻擊通過在看似無害的內容中嵌入惡意指令來操縱 AI 代理——例如 Google 文件、電子郵件或網頁。當 AI 瀏覽器處理此內容時,它會遵循隱藏的指令而不是其預期目的。後果範圍從數據洩露到可能危及個人和財務資訊的未經授權行動。
OpenAI 最近的部落格文章承認了這一基本漏洞:「提示注入,就像網路上的詐騙和社交工程一樣,不太可能完全『解決』。」這一承認是在該公司努力加固其 ChatGPT Atlas 瀏覽器以抵禦日益複雜的攻擊時發表的。
當 OpenAI 於十月推出其 ChatGPT Atlas 瀏覽器時,安全研究人員立即展示了漏洞。在幾個小時內,他們展示了 Google 文件中的幾個字如何改變瀏覽器的底層行為。這一快速發現突顯了一個系統性挑戰,該挑戰不僅限於 OpenAI,還延伸到其他 AI 驅動的瀏覽器,如 Perplexity 的 Comet 以及任何使用代理 AI 的系統。
核心問題在於 OpenAI 所稱的「代理模式」——允許 AI 採取自主行動的功能。正如該公司承認的那樣,這種模式「顯著擴大了安全威脅面」。與僅顯示內容的傳統瀏覽器不同,AI 瀏覽器會解釋並對該內容採取行動,為惡意行為者創造了多個入口點。
AI 瀏覽器安全性比較| 瀏覽器類型 | 主要功能 | 主要漏洞 | 風險等級 |
|---|---|---|---|
| 傳統瀏覽器 | 內容顯示 | 惡意軟體、網路釣魚 | 中等 |
| AI 瀏覽器(基礎版) | 內容解釋 | 提示注入 | 高 |
| AI 瀏覽器(代理模式) | 自主行動 | 複雜提示注入 | 非常高 |
OpenAI 並非唯一認識到這一持久威脅的組織。英國國家網路安全中心最近警告稱,針對生成式 AI 應用程式的提示注入攻擊「可能永遠無法完全緩解」。他們對網路安全專業人員的建議很有說服力:專注於降低風險和影響,而不是試圖完全阻止這些攻擊。
這種觀點代表了我們處理 AI 安全方式的根本轉變。行業必須開發分層防禦和快速響應機制,而不是尋求完美保護。正如網路安全公司 Wiz 的首席安全研究員 Rami McCarthy 所解釋的:「在 AI 系統中推理風險的一個有用方法是自主性乘以訪問權限。代理瀏覽器往往處於該空間的一個具有挑戰性的部分:中等自主性與非常高的訪問權限相結合。」
在承認提示注入威脅的持久性的同時,OpenAI 正在部署創新的對策。他們最有希望的方法涉及「基於 LLM 的自動化攻擊者」——一個使用強化學習訓練的機器人,充當尋找漏洞的駭客。
該系統通過持續循環運作:
OpenAI 報告稱,這種方法已經發現了在人工測試或外部報告中沒有出現的新穎攻擊策略。在一次演示中,他們的自動化攻擊者將一封惡意電子郵件放入用戶的收件箱,導致 AI 代理發送辭職訊息而不是草擬外出回覆。
在像 OpenAI 這樣的公司致力於系統性解決方案的同時,用戶可以採取實際步驟來降低其風險暴露。OpenAI 建議幾個關鍵策略:
正如 McCarthy 指出的:「對於大多數日常使用案例,代理瀏覽器尚未提供足夠的價值來證明其當前的風險狀況是合理的。考慮到它們對電子郵件和支付資訊等敏感數據的訪問,風險很高,儘管這種訪問也是使它們強大的原因。」
提示注入的挑戰代表了 OpenAI 所稱的「長期 AI 安全挑戰」,需要持續加強防禦。該公司的方法結合了大規模測試、更快的修補週期和主動漏洞發現。雖然他們拒絕分享有關攻擊減少的具體指標,但他們強調與第三方的持續合作以加固系統。
這場戰鬥並非 OpenAI 獨有。像 Anthropic 和 Google 這樣的競爭對手正在開發自己的分層防禦。Google 最近的工作重點是代理系統的架構和策略級控制,而更廣泛的行業認識到傳統安全模型並不完全適用於 AI 瀏覽器。
OpenAI 承認的清醒現實很明確:針對 AI 瀏覽器的提示注入攻擊代表了一個基本的、持久的威脅,可能永遠無法完全消除。隨著 AI 系統變得更加自主並獲得對我們數位生活的更大訪問權限,攻擊面相應擴大。行業從預防轉向風險管理反映了這一新現實。
對於用戶來說,這意味著以適當的謹慎態度使用 AI 瀏覽器——了解其功能的同時認識其漏洞。對於開發人員來說,這意味著採用持續測試、快速響應週期和分層安全方法。AI 進步與 AI 安全之間的競賽已進入新階段,正如 OpenAI 的警告所示,在這場持續的戰鬥中沒有輕鬆的勝利。
要了解更多關於最新 AI 安全趨勢和發展的資訊,請探索我們對塑造 AI 安全和網路安全措施的關鍵發展的全面報導。
OpenAI 對提示注入攻擊的立場是什麼?
OpenAI 承認針對像 ChatGPT Atlas 這樣的 AI 瀏覽器的提示注入攻擊代表了一個持久的威脅,可能永遠無法完全解決,類似於傳統的網路詐騙和社交工程。
OpenAI 的自動化攻擊者系統是如何運作的?
OpenAI 使用基於 LLM 的自動化攻擊者,該攻擊者使用強化學習訓練以模擬駭客攻擊嘗試。該系統通過在模擬中測試攻擊並研究目標 AI 如何響應來發現漏洞。
還有哪些組織警告過提示注入風險?
英國國家網路安全中心警告稱,提示注入攻擊可能永遠無法完全緩解。來自 Wiz 等公司的安全研究人員也強調了系統性挑戰。
在安全性方面,AI 瀏覽器與傳統瀏覽器有何不同?
AI 瀏覽器解釋並對內容採取行動,而不是僅僅顯示它。這種「代理模式」為攻擊創造了更多入口點,並且需要與傳統瀏覽器不同的安全方法。
用戶可以採取哪些實際步驟來降低提示注入風險?
用戶應該限制 AI 瀏覽器對敏感系統的訪問,要求對重要操作進行確認,提供具體而非模糊的指令,並定期監控 AI 代理行為。
本文 OpenAI 的警告承認:AI 瀏覽器面臨提示注入攻擊的永久威脅 首次出現在 BitcoinWorld。


