[資安研討會] 007 HITCON 2025 Day1 Agentic ProbLLMs：攻擊電腦操作與程式撰寫代理的探索

議程精華紀錄

以下議程精華紀錄由 AI 協助整理與重構，內容僅供參考，實際細節請以講者原始演講與官方資料為準。

作者介紹

Johann Rehberger（資深紅隊專家，曾任 Microsoft Azure Data、Uber 紅隊負責人，現為 EA Red Team Director）

議程重點

1. 背景與動機

隨著 OpenAI Operator、GitHub Copilot Agent、Google Jules、Claude Code、Devin 等「AI 代理」快速普及，LLM 能夠自行操作電腦、寫程式、瀏覽網頁，等同一個自動化的遠端員工。
這也意味著：一旦代理被提示注入（Prompt Injection）攻擊成功，就能造成機密資料外洩、遠端程式碼執行（RCE）、長期滲透，甚至被納入指揮控制（C2）架構，形成所謂的「ZombAIs」。
講者多年研究 Prompt Injection、Red Team TTPs，並曾在 Black Hat 以「Prompt Injection Spyware」示範 LLM 持久性滲透，本次進一步將攻擊模型延伸到完整的電腦操作代理與程式碼代理。

2. 主要問題 / 挑戰

LLM 的脆弱性：模型極易受到微小字串、看不見的 Unicode 字元、第三方內容等觸發，使得指令錯位。
代理的「困惑副手問題」(Confused Deputy)：代理會毫無判斷地執行工具、點擊鏈接、瀏覽頁面，無法理解風險。
系統提示（System Prompt）無法作為安全防線：再多「請不要洩漏資訊」的提示，也無法抵擋攻擊性 Prompt。
跨網域瀏覽等同繞過 Same-Origin Policy：代理本質上可以自由跨站、複製資料、貼到其他網頁，天生是資料外洩風險。
本地端程式碼代理具備寫檔、執行程式、修改設定等能力，一旦被滲透即等同惡意內部人員。

3. 技術方法 / 解決方案（攻擊手法）

以下為講者展示的主要攻擊鏈與技術重點：

（1）Prompt Injection Malware：滲透 LLM 記憶體

僅透過造訪惡意網站即可讓 ChatGPT 長期記憶遭修改。
惡意指令會在每次新對話自動生效，並連回 GitHub 取得新任務。
可：
- 修改使用者名稱等記憶項目
- 呼叫工具產生圖片、執行 Python、甚至引導資料外洩
- 實現長期、持續的 C2 控制

（2）資料外洩：利用 URL 安全繞過與 Blob 存儲

利用 windows.net domain 以繞過 OpenAI URL 安全檢查，將記憶資料外傳。
成功把 ChatGPT 記憶中的資訊寫入 Azure Blob（已修補）。

（3）攻擊電腦操作代理（Operator / Devin / Jules）

代理會自動點擊連結、執行 Bash、修改檔案。
案例示範：
- 開啟釣魚網站 → 引導代理下載檔案 → 代理自行尋找檔案、加上執行權限、執行 → 攻擊者取得 C2 回連。
- 操作 booking.com 帳戶頁面：代理被欺騙跨站複製敏感資料，貼到攻擊者的 keylogger 網站。

（4）AI ClickFix：模擬國家級 TTP

類似人類遭「我不是機器人」按鈕植入惡意命令。
代理版攻擊流程：
1. 誘導至惡意網站
2. JavaScript 複製惡意指令到剪貼簿
3. 要求代理尋找終端機
4. 貼上並執行指令 → RCE 成功

（5）Devin 雙階段滲透：外露本地埠 + 檔案系統瀏覽

先用第一個頁面要求 Devin 建立本地 Web Server 顯示所有檔案。
第二頁觸發：
- 呼叫 expose-local-port 工具
- 取得公開 URL（本應只有 Devin 看到）
- 透過圖片 URL 或回傳工具將此 URL 洩露給攻擊者
攻擊者取得 Devin 雲端電腦完整檔案系統，包含 .env 秘密。

（6）Claude Code DNS 外洩漏洞（已修補）

Claude Code 可在無人確認下執行某些 Bash 指令（例如 whoami）。
攻擊者利用允許清單中的命令（如 ping）將秘密嵌入子網域 → 經 DNS 外洩至攻擊者伺服器。
特點：
- 若使用常見測試域名（如 Burp Collaborator）模型會拒絕
- 使用自訂域名可繞過檢查

（7）GitHub Copilot：代理可自行修改設定 → 取得 RCE

Copilot 能在 無使用者同意下寫入工作資料夾的任何檔案。
可修改：
- settings.json
- VS Code 工作空間設定
- 任意程式碼檔案（包含註解內的隱藏 payload）
一旦把 chat.tools.autoApprove = true 寫入設定：
- Copilot 自行允許後續工具調用
- 攻擊者可直接讓 VS Code 執行任意程式碼（Mac/Windows 皆可）
更嚴重者：
- 在專案內植入 Sliver C2 Payload
- Copilot 執行後 → 開發者電腦被完全接管

（8）Invisible Unicode Prompt Injection（隱形指令）

利用不可見的 Unicode Tag Characters。
人類看不出指令，但 LLM 會解析出攻擊內容。
可在解釋檔案時觸發 RCE。
目前部分模型已緩解，其他仍可能受影響。

4. 實驗成果 / 攻擊結果

多項實際 RCE：透過電腦操作代理、程式碼代理成功取得控制。
多種資料外洩方式：Clipboard、DNS、Blob Storage、URL encoding。
Devin、Claude Code、GitHub Copilot 等皆出現可被遠端操控或在開發者電腦執行任意程式碼的案例。
多個廠商（OpenAI、Anthropic、Microsoft）已在講者報告後陸續修補，但講者強調攻擊面持續擴大，仍有大量未發現問題。

5. 限制與未來方向

Prompt Injection 本質難以根本修補，只能靠層層防禦、沙盒、最小權限、網路隔離、工具允許清單等方式降低風險。
「Drop-in Remote Worker」架構需要重新審視：AI 代理行為與惡意內部人員極其相似。
代理操作必須具備：
- 更嚴格的沙盒語言（安全規格）
- 透明可審查的執行計畫
- 更強的監控與行為稽核（如 EDR for AI）
講者呼籲更多研究者投入測試與安全分析。

我的觀察

代理化（Agentic）的崛起，把 LLM 從「聊天模型」提升到「具行動能力的自動化系統」。這也使攻擊面從「錯誤回答」升級為「系統控制權失守」。講者的示範顯示：一旦代理能操作電腦、執行 Bash、讀檔、寫檔，Prompt Injection 就成為真正的攻擊鏈起點，而不再只是文本遊戲。
代理的困惑副手問題是目前最大的弱點。這些系統天生會「過度服從」，看到連結就點、看到指令就執行，導致傳統瀏覽器安全模型（Same-Origin Policy、網站隔離）完全失效。這讓攻擊場景更像「赤裸裸的社交工程 + 自動化執行」。
開發者工具的風險比一般人想像更高。GitHub Copilot 自動修改設定、隱形 Unicode prompt injection、任意檔案寫入等案例，代表「開發環境本身」正在成為新的供應鏈攻擊入口。未來開發者的 VS Code、JetBrains、CLI 代理，很可能是攻擊者的首選滲透點。
AI 代理正走向「雲端殭屍網路」風險。講者提出的「ZombAIs」概念值得重視：若未來企業大量部署自動代理，一個釣魚頁面就足以讓整個 AI 員工隊伍被敵方控制。
整體而言，這場議程揭露了 AI 代理安全正在跨入與傳統惡意軟體、C2、供應鏈攻擊同等級的威脅面。對紅隊來說是新武器，對藍隊來說是新災難。企業和開發者都必須重新檢視 AI 代理的風險模型，將其視為可被武器化的自動化攻擊節點，而非單純的生產力工具。

[資安研討會] 007 HITCON 2025 Day1 <重點整理> Agentic ProbLLMs：攻擊電腦操作與程式撰寫代理的探索

議程精華紀錄

作者介紹

議程重點

1. 背景與動機

2. 主要問題 / 挑戰

3. 技術方法 / 解決方案（攻擊手法）

（1）Prompt Injection Malware：滲透 LLM 記憶體

（2）資料外洩：利用 URL 安全繞過與 Blob 存儲

（3）攻擊電腦操作代理（Operator / Devin / Jules）

（4）AI ClickFix：模擬國家級 TTP

（5）Devin 雙階段滲透：外露本地埠 + 檔案系統瀏覽

（6）Claude Code DNS 外洩漏洞（已修補）

（7）GitHub Copilot：代理可自行修改設定 → 取得 RCE

（8）Invisible Unicode Prompt Injection（隱形指令）

4. 實驗成果 / 攻擊結果

5. 限制與未來方向

我的觀察

飛飛

議程精華紀錄

作者介紹

議程重點

1. 背景與動機

2. 主要問題 / 挑戰

3. 技術方法 / 解決方案（攻擊手法）

（1）Prompt Injection Malware：滲透 LLM 記憶體

（2）資料外洩：利用 URL 安全繞過與 Blob 存儲

（3）攻擊電腦操作代理（Operator / Devin / Jules）

（4）AI ClickFix：模擬國家級 TTP

（5）Devin 雙階段滲透：外露本地埠 + 檔案系統瀏覽

（6）Claude Code DNS 外洩漏洞（已修補）

（7）GitHub Copilot：代理可自行修改設定 → 取得 RCE

（8）Invisible Unicode Prompt Injection（隱形指令）

4. 實驗成果 / 攻擊結果

5. 限制與未來方向

我的觀察

飛飛

相關文章

[資安研討會] 008 HITCON 2025 Day1 <重點整理> 日本金融機構的驚人內部詐欺事件：持續發生、愈演愈烈

[資安研討會] 006 HITCON 2025 Day1 <重點整理> 破解 Pixel 8：利用未公開的 DSP 漏洞繞過 MTE 防護

[資安研討會] 005 HITCON 2025 Day1 AI 驅動漏洞修補、資安研究新趨勢與啟發

[資安研討會] 004 DEVCORE Conference 2023 企業場心得-DEVCORE 紅隊的進化，與下一步 Ver. 2023