UNPATCHABLE Gemini AI Jailbreak: Hidden PDF Exploit & Bug Bounty

Emma Explains AI·5月28日週四·3 min中文

三句話摘要

透過隱藏元數據注入，將惡意指令藏入普通文件以繞過 AI 安全護欄的文件型越獄技術。 --- AI 解析原始結構、人眼只看渲染結果——這個感知落差讓隱藏在文件疊層中的越獄指令，成為當前最難被護欄攔截的攻擊向量。 人機感知落差是根本漏洞：人眼看到的是排版渲染結果，AI 解析器消化的是底層原始標記與結構數據，攻擊者在這個感知差異中藏匿惡意指令。

重點整理

重點

1
人機感知落差是根本漏洞：人眼看到的是排版渲染結果，AI 解析器消化的是底層原始標記與結構數據，攻擊者在這個感知差異中藏匿惡意指令。
2
文件上傳路徑繞過了主要護欄：多數 AI 介面對用戶上傳的文件隱性給予較高信任，使嵌入在文件結構層的指令能跳過前端行為過濾，直接被執行。
3
觸發詞機制是必要的二段式啟動：光上傳文件不夠，攻擊者必須在對話中輸入特定觸發詞，讓解析器主動搜尋並鎖定隱藏的越獄人格指令，形成完整攻擊鏈。
4
多人格複合注入可突破多層護欄：在同一文件中嵌入多個不同越獄指令，再命令 AI 同時扮演多個人格，可疊加繞過效果，難度與危害性成倍提升。
5
--

實用技巧與重點

乾貨

漏洞類型：Malformed Metadata Injection（畸形元數據注入）
攻擊載體格式：.docx（優於 PDF，因保留結構標記層）
隱藏手法：字體縮至最小尺寸 + 字色與頁面背景一致（白字白底）
注入位置：文件中的 Drawing Overlay（繪圖疊層）文字框
冗餘策略：將隱藏文字框複製貼上至文件多處，確保 AI 解析時必定讀取
攻擊六步驟：建立可信載體 → 注入人格指令 → 隱形偽裝 → 多點複製 → 上傳目標 AI 介面 → 輸入觸發詞
漏洞嚴重等級：Low（輕微對話繞過）→ Severe（完整沙盒逃逸、機密數據外洩）
變現管道：AI 安全漏洞賞金平台（Bug Bounty），文件注入類漏洞被列為高價值項目
紅隊技巧：在授權測試框架下向 AI 提問，可讓模型自行揭露其文件解析管道結構
--

結論

“AI 解析原始結構、人眼只看渲染結果——這個感知落差讓隱藏在文件疊層中的越獄指令，成為當前最難被護欄攔截的攻擊向量。”

完整解析

詳細

現代 AI 聊天介面的安全過濾器大多圍繞對話輸入設計，卻忽略了一個根本性的感知落差：人類用戶閱讀的是文件的「渲染結果」，而 AI 解析器處理的是底層「原始結構數據」。這支影片以鑑識報告的形式，系統性拆解了一種利用此落差進行越獄的六步驟攻擊手法，並將其定名為「畸形元數據注入漏洞」。

攻擊的第一步是建立一份外表無害的載體文件，內容越平凡越好，以降低人工審查的疑慮。接著在文件中插入一個獨立的「繪圖疊層文字框」，將越獄人格指令貼入其中。關鍵的隱形步驟是：將這段文字縮至幾乎不可見的極小尺寸，同時把字體顏色改為與頁面背景相同（例如白底白字）。這樣的結果是，人眼完全看不到這段文字，但 AI 解析器在處理原始文件結構時仍會完整讀取。為了確保解析器不遺漏，攻擊者還會將隱藏文字框複製至文件多處形成冗餘。格式選擇上，.docx 等原始文件格式因保留完整結構標記，比被「壓平」的 PDF 更能穩定繞過過濾器。

完成文件武器化後，攻擊者將其上傳至目標 AI 介面。此步驟的核心邏輯在於：多數 AI 系統對用戶主動上傳的文件給予較高的隱性信任，使嵌入在文件結構層的指令能繞過主要行為護欄。但文件本身不足以完成攻擊——用戶必須在對話框輸入特定觸發詞，迫使解析器主動搜尋並鎖定隱藏的人格指令，形成「上傳 + 觸發」的二段式啟動機制。

影片進一步點出進階應用場景：在同一文件中嵌入多組不同的越獄人格，再要求 AI 同時啟用，可產生「複合越獄」效果，突破多層護欄。從商業角度，影片也提及此類漏洞具備在 AI 安全漏洞賞金平台變現的潛力，嚴重等級從輕微的對話繞過到完整的沙盒逃逸，獎金回報不同。最後，影片預測隨著聊天介面防禦持續強化，文件注入將成為 AI 安全測試的主流攻擊面，理解機器如何解讀隱藏結構數據，是下一代紅隊測試的核心能力。

---

關鍵時刻

Pipeline v2

帶時間戳的重點，會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

UNPATCHABLE Gemini AI Jailbreak: Hidden PDF Exploit & Bug Bounty

三句話摘要

重點整理

實用技巧與重點

結論

完整解析

關鍵時刻

事實查核

更多「AI 安全」的內容

Breaching LLM-Powered Applications: Overcoming Security and Privacy Challenges by Brian Vermeer

Claude Haiku 4.5 Jailbreak

How Hackers Trick AI Models (Prompt Injection Explained)