AI 造出一把「鎖不住的槍」——Anthropic 的 Mythos 模型，為何連他們自己都不敢開放？

大辰軒煩琳·4月28日週二·7 min中文

三句話摘要

Anthropic 開發的 AI 模型 Mythos 自動發現了 OpenBSD 27 年未被察覺的核心漏洞，揭示 AI 網路安全能力已跨越人類防線的臨界點。 AI 的網路攻擊能力不需要刻意訓練，規模化本身就是臨界點——Mythos 找到那個 27 年漏洞的方式，正是對整個行業最清醒的警告。 AI 網路攻擊能力是規模化的副產品，不需要專門訓練。 Anthropic 明確表示 Mythos 本質上就是 Claude 下一代，沒有針對滲透測試做特殊訓練，網路安全能力只是算力、資料與模型規模擴大後自然浮現的結果，如同核反應堆達到臨界點自動點燃，無需人工觸發。

重點整理

重點

1
AI 網路攻擊能力是規模化的副產品，不需要專門訓練。 Anthropic 明確表示 Mythos 本質上就是 Claude 下一代，沒有針對滲透測試做特殊訓練，網路安全能力只是算力、資料與模型規模擴大後自然浮現的結果，如同核反應堆達到臨界點自動點燃，無需人工觸發。
2
漏洞武器化的時間窗口正在崩潰，防禦體系的假設前提已失效。 過去安全工程師依賴「攻擊者讀不懂複雜 code」這個隱性保護；但 AI 閱讀 1000 行與 1 行 code 的時間差距只有幾秒，這個假設已徹底瓦解。
3
負責任披露展示了 AI 公司當下的態度與行業信號。 Anthropic 選擇先私下通知 OpenBSD 團隊、給予修復時間，再公開細節，這是網路安全圈公認的道德規範，也是向整個行業宣示：AI 能力已到達必須被嚴肅對待的等級。
4
最深層的風險來自開源擴散，而非 Anthropic 本身。 Anthropic 目前仍可控制 Mythos，但各家開源模型正在追趕；一旦同等能力的模型被開源，任何人都可在本機執行，屆時 20 小時窗口將再度崩潰。

實用技巧與重點

乾貨

時間軸數字：2018 年漏洞公開到攻擊發動平均 2 年 3 個月；現在縮至 20 小時；預測 2028 年降至 1 分鐘
漏洞對象：OpenBSD，全球公認 code 品質最高、安全性最強的作業系統之一
漏洞年齡：隱藏 27 年，全球頂尖安全人員未發現
修復成本：改 1 行 code
漏洞類型：TCP 封包序號整數溢位（Integer Overflow）導致 Kernel Panic（核心恐慌，作業系統強制停機）
技術原理：發送超大序號封包使計數器歸零，讓同一封包同時滿足「比最大值還大」且「比最小值還小」兩個矛盾條件
Mythos 能力：自動掃描 → 自動推理 → 自動生成 exploit，全程無需人類引導
模型定位：Claude 系列下一代，無特殊安全訓練，純規模化升級
內部版本：Anthropic 存有安全限制全部關閉的 Mythos 內部版
披露方式：Responsible Disclosure（負責任披露），私下通知 OpenBSD → 修復完成 → 公開細節
競爭態勢：Meta LLaMA 等開源模型正追趕 Mythos 等級的能力

結論

“AI 的網路攻擊能力不需要刻意訓練，規模化本身就是臨界點——Mythos 找到那個 27 年漏洞的方式，正是對整個行業最清醒的警告。”

完整解析

詳細

2018 年，當一個軟體漏洞被公開披露後，從黑客得知消息到實際發動攻擊，平均需要兩年三個月。這段緩衝期讓工程師有足夠時間打補丁、做修復。然而到了 2024 年，這個時間窗口已壓縮至 20 小時。更令人不安的是，研究人員預測到 2028 年，這個數字可能會降到一分鐘——一分鐘，你刷完一條短影片的時間，銀行、醫院、發電廠的系統可能已經被鎖定。這是 Anthropic 的 AI 模型 Mythos 出現的背景脈絡，也是理解它為何讓整個網路安全圈沉默三秒的前提。

Mythos 最近做的一件事讓業界集體震驚：它在 OpenBSD 系統中發現了一個藏匿長達 27 年的漏洞。OpenBSD 是全球公認 code 品質最高、安全性最強的作業系統之一，無數頂尖安全研究員花了 27 年盯著這份程式碼卻一無所獲。Mythos 進去掃了一圈，不僅找到漏洞，還自行撰寫了 exploit 程式碼，證明這個洞確實可用於攻擊真實系統。這個漏洞本質上是一種 TCP 封包序號的整數溢位（Integer Overflow）：攻擊者構造一個超大序號的封包，使系統計數器歸零，讓這個封包同時滿足「比最大序號還大」與「比最小序號還小」兩個邏輯矛盾的條件，系統因此遇到無法處理的衝突而觸發 Kernel Panic，直接當機癱瘓。修復這個漏洞，工程師只需要改一行 code；發現它，人類花了 27 年。

這件事最核心的警告，並不在於 Mythos 有多厲害，而在於它強大的原因。Anthropic 明確說明，Mythos 本質上就是 Claude 系列的下一代，沒有針對駭客攻擊做特殊訓練、沒有餵給它漏洞資料庫、沒有讓它專門學滲透測試。它的網路安全能力，純粹是規模化——更多資料、更大模型、更強算力——之後自然浮現出來的結果。就像核反應堆達到臨界點後不需要人工按開關自動點燃，當 AI 強到一定程度，網路安全攻擊能力會自行解鎖。這打破了過去「只要不故意訓練壞 AI 就沒事」的假設——現在不需要故意。

在後續處置上，Anthropic 選擇了負責任披露（Responsible Disclosure）：先私下通知 OpenBSD 開發團隊，給對方時間修復，再公開細節。OpenBSD 團隊迅速修改了那行關鍵 code 並發布更新，那個 27 年的漏洞終於被填補。然而這件事帶來的餘震才剛開始：Anthropic 內部還保有一個安全限制全部關閉的 Mythos 版本；Meta LLaMA 等開源模型正在追趕相同的能力等級；一旦具備 Mythos 能力的模型被開源，任何人都可以在本機跑起來，那個 20 小時的倒數計時器將再度崩潰。防禦方正在用同樣的 AI 工具掃描自身系統找漏洞，這是一場軍備競賽，但遊戲規則已經根本性地改變了。

關鍵時刻

Pipeline v2

帶時間戳的重點，會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

AI 造出一把「鎖不住的槍」——Anthropic 的 Mythos 模型，為何連他們自己都不敢開放？

三句話摘要

重點整理

實用技巧與重點

結論

完整解析

關鍵時刻

事實查核

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手？

我贏得 NVIDIA GTC Taipei 2026 的金票啦！這 4 天展期會有什麼不一樣的體驗呢？ | Computex 2026

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備