https://img-cdn.gateio.im/social/moments-178333a912fa8e269501153cf8a71818(演示測試。來源:OpenAI博客。在這個例子中,自動化的惡意攻擊者向用戶的郵箱發送了一封郵件。然後,AI代理掃描了電子郵件服務,並執行了隱藏的指令,發送了一封解僱通知,而不是回復缺席工作的信息。在安全更新後,“代理模式”能夠檢測到突發的提示注入嘗試並將其標記給用戶。OpenAI強調,雖然這種攻擊類型很難有效防御,但它依賴於大規模測試和快速修復週期。## 用戶建議Wiz的首席安全研究員Rami McCarthy強調,強化學習是持續適應惡意行爲者的一種主要方式,但這只是全貌的一部分。> > «有益的思考人工智能系統風險的方式是:自主性乘以可達性。代理瀏覽器處於這個領域的復雜部分:適度的自主性結合極高的可達性。許多當前的建議反映了這一妥協。登入後限制訪問首先降低了脆弱性,而要求對請求進行確認則限制了自主性,» 專家說。> > > 這些建議是OpenAI爲用戶提供的,旨在降低風險。該初創公司還建議給代理人提供具體的指示,而不是提供訪問郵件的權限,並要求“採取任何必要的行動”。麥卡錫指出,至今爲止,內置人工智能代理的瀏覽器並沒有帶來足夠的好處,以證明其風險配置是合理的。> > «這個餘額將會發展,但今天的妥協仍然非常現實,» — 他說。> > > 提醒大家,在11月,微軟的專家們展示了一個用於測試AI代理的環境,並發現了現代數字助手固有的漏洞。
«提示注入»已成爲AI瀏覽器的主要威脅 - ForkLog: 加密貨幣,AI,奇點,未來
https://img-cdn.gateio.im/webp-social/moments-178333a912fa8e269501153cf8a71818.webp(演示測試。來源:OpenAI博客。在這個例子中,自動化的惡意攻擊者向用戶的郵箱發送了一封郵件。然後,AI代理掃描了電子郵件服務,並執行了隱藏的指令,發送了一封解僱通知,而不是回復缺席工作的信息。
在安全更新後,“代理模式”能夠檢測到突發的提示注入嘗試並將其標記給用戶。
OpenAI強調,雖然這種攻擊類型很難有效防御,但它依賴於大規模測試和快速修復週期。
用戶建議
Wiz的首席安全研究員Rami McCarthy強調,強化學習是持續適應惡意行爲者的一種主要方式,但這只是全貌的一部分。
這些建議是OpenAI爲用戶提供的,旨在降低風險。該初創公司還建議給代理人提供具體的指示,而不是提供訪問郵件的權限,並要求“採取任何必要的行動”。
麥卡錫指出,至今爲止,內置人工智能代理的瀏覽器並沒有帶來足夠的好處,以證明其風險配置是合理的。
提醒大家,在11月,微軟的專家們展示了一個用於測試AI代理的環境,並發現了現代數字助手固有的漏洞。