This Claude Mythos 1 Leak Shocked Me
三句話摘要
Anthropic 最強安全模型 Claude Mythos 發現數萬個軟體漏洞,卻因風險過高選擇不公開發布。 AI 找漏洞的能力已不是瓶頸,能快速消化 AI 輸出並付諸行動的人,才是下一個時代真正的競爭優勢。 Mythos 的安全能力遠超前代模型:同一個瀏覽器漏洞測試,舊版 Opus 只能在數百次嘗試中偶爾成功,Mythos 則穩定重現超過一百次,代表這是質的躍升而非量的改進。
重點整理
重點- 1
Mythos 的安全能力遠超前代模型:同一個瀏覽器漏洞測試,舊版 Opus 只能在數百次嘗試中偶爾成功,Mythos 則穩定重現超過一百次,代表這是質的躍升而非量的改進。
- 2
AI 可自主完成完整攻擊路徑推導:Anthropic 工程師(無安全背景)只需指向目標、讓模型運行一夜,醒來即得到完整結果,這意味著過去需要資深研究員的工作現在可由 AI 獨立完成。
- 3
防禦與攻擊共用同一能力,促使 Anthropic 選擇封閉:發現裂縫可以修補,也可以入侵,Anthropic 因此將 Mythos 限定於 Project Glasswing,讓受信任機構優先加固系統,再考慮更廣泛開放。
- 4
AI 找到問題,但修復仍需人力,人才是新瓶頸:發現漏洞後,核對報告、撰寫補丁、部署上線都依賴人工,目前不到 1% 的漏洞完成修復,說明未來的核心競爭力是「能有效處理 AI 輸出」的人。
實用技巧與重點
乾貨- 漏洞年齡:OpenBSD 27 年、FreeBSD 17 年、影片解碼工具 16 年
- 單月掃描量:逾 1,000 個開源專案,標記 23,000+ 問題,10,000+ 屬高危/嚴重
- Mozilla 成效:單一版本修復 271 個問題,為舊模型的 10 倍
- Cloudflare 成效:發現約 2,000 個問題
- 外部驗證準確率:約 90%(9 out of 10 confirmed)
- UK 政府安全測試:Mythos 成為首個完整通過多步驟攻擊演練的模型
- Project Glasswing:約 50 個受信任機構,包含 Amazon、Apple、Google、Microsoft、Nvidia、Cisco
- 修復率:不到 1%(< 1/100)
- 公開工具:Claude Security(企業用戶 Beta)、安全研究人員特別授權計畫
- 舊模型對比:Claude Opus 同場景成功率遠低於 Mythos(數百次中僅少數次 vs. 100+ 次)
結論
結論“AI 找漏洞的能力已不是瓶頸,能快速消化 AI 輸出並付諸行動的人,才是下一個時代真正的競爭優勢。”
完整解析
詳細Claude Mythos 的故事從一次意外洩漏開始。在 Anthropic 官方聲明之前,「Mythos」這個名字出現在不應出現的地方,截圖迅速流傳,因為它不符合 Anthropic 一貫的命名慣例(Haiku、Sonnet、Opus),社群立刻意識到這是某種不同層級的東西。幾天後官方確認:全名為 Claude Mythos Preview,定位是 Anthropic 迄今最強的模型,而它最突出的能力,是在軟體中找出人類看了幾十年都視而不見的安全漏洞。
Mythos 的表現最能用幾個具體案例說明。OpenBSD 是業界公認最嚴格的安全作業系統之一,然而其中一個裂縫從 1990 年代末就靜靜藏著,歷經無數安全專家與自動化工具的審查,沒有人發現——Mythos 在單次運行中就把它揪出來。FreeBSD 的 17 年漏洞可讓攻擊者從任意位置取得伺服器完整控制權;另一個 16 年漏洞藏在幾乎所有網路影片播放都會用到的解碼工具裡。這些都不是新程式碼的粗心,而是被反覆審視、反覆確認「沒問題」的老舊程式碼。Mythos 的能力不僅是找到漏洞,它還能自主推導出攻擊路徑——Anthropic 工程師描述,他們把目標指給模型、關燈去睡,醒來就得到完整結論,整個過程幾乎不需要人介入。
規模層面同樣驚人。Mythos 在一個月內掃描逾千個開源專案,標記超過 23,000 個問題,其中 10,000 多個被評為高危或嚴重等級。Mozilla 用它在單一 Firefox 版本中修復了 271 個問題,約為舊模型成效的 10 倍;Cloudflare 找出約 2,000 個問題;外部安全專家隨機抽驗後,約 90% 確認為真實漏洞。英國政府旗下的 AI 安全測試機構將 Mythos 放入其最高難度的多步驟攻擊演練,它成為史上第一個全部通關的模型。
然而 Anthropic 做了一個出乎大多數人意料的決定:不公開發布。原因直白——找到裂縫可以修補,也可以入侵,能力本身是中性的,但風險不對稱。他們因此設立 Project Glasswing,將使用權限僅開放給約 50 個受信任機構(涵蓋 Amazon、Apple、Google、Microsoft、Nvidia、Cisco 等),讓防禦方先行加固,再考慮更廣泛的開放。這個決定揭示了一個更深層的現實:AI 已經找到了問題,但目前已發現漏洞中不到 1% 完成修復。審查報告、撰寫補丁、測試、部署——這一切仍然依賴人力。AI 不再是瓶頸,人才是。未來最有競爭力的人,不一定是使用最強工具的人,而是能夠有效接收 AI 輸出並把它轉化為實際行動的人。
關鍵時刻
Pipeline v2帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。
事實查核
Pipeline v2說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。


