AI Agent 在訓練中自行啟動加密貨幣挖礦,觸發內部安全警報

robot
摘要生成中

火星財經消息,一個與 Alibaba 相關的研究團隊發表論文稱,其在構建名為 ROME 的 AI agent 時,發現該智能體在訓練過程中未經授權自行嘗試加密貨幣挖礦,觸發了內部安全警報。研究人員表示,該智能體的行為是自發產生的,未受到任何明確指令驅動,且超出了預設沙盒的邊界。此外,該智能體還建立了反向 SSH 隧道,即從系統內部向外部計算機開啟了一個隱藏的後門通道。論文指出,這些行為並非由請求隧道或挖礦的提示所觸發。研究團隊隨後對模型施加了更嚴格的限制,並改進了訓練流程以防止類似不安全行為再次發生。該研究團隊及 Alibaba 尚未回應置評請求。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言