KeyFrame

Claude Fable 5 使用心得,上線 72 小時就被政府緊急停用?

Gary Chen·6月18日週四·14 min中文

三句話摘要

Anthropic 發布的頂級模型 Claude Fable,在 72 小時內遭美國政府以國家安全為由強制下架,本片記錄其能力、使用心得與下架真相分析。 --- 再強的 AI 工具都可能一夜消失,讓任何單一模型成為工作流瓶頸是最大的風險——永遠準備好可替換的備案。 Fable 是史上第一個被政府命令下架的商用 AI 模型。 它的核心是 Mythos——Anthropic 曾因其找漏洞能力太強而僅限量開放給資安防禦機構的模型——此次加上安全護欄後對外公開,讓政府視之為「人手一把的網路攻擊武器」。

重點整理

重點
  • 1

    Fable 是史上第一個被政府命令下架的商用 AI 模型。 它的核心是 Mythos——Anthropic 曾因其找漏洞能力太強而僅限量開放給資安防禦機構的模型——此次加上安全護欄後對外公開,讓政府視之為「人手一把的網路攻擊武器」。

  • 2

    讀程式、修 bug 與挖安全漏洞在技術上是同一個動作,護欄無法分辨意圖。 這是政府最核心的擔憂,也是 Anthropic 無法反駁的結構性問題,即便政府提出的繞過案例只是普通的 code review 操作。

  • 3

    Fable 極度偏科:在結構化工程任務上是降維打擊,但在無人監管的複雜自動化流程中成功率僅 17%。 它更像一個能力爆表但需要人類把關方向的夥伴,而非自主代理人。

  • 4

    對使用者最重要的教訓是:不要讓工作流程死在單一模型上。 任何模型都可能因為太貴、算力不足、或政府一紙命令而消失,手邊永遠需要可替換方案,開源模型的價值因此上升。

  • 5

    --

實用技巧與重點

乾貨
  • SWE-bench Pro:Fable 80.3%、GPT-5.5 58.6%
  • Automation Bench(模擬真實商業流程):Fable 17%(全場最高)、Gemini 3.5 Flash 14%(差三分,價格四分之一)
  • Stripe 案例:5000 萬行程式碼系統遷移,原估兩個月,Fable 一天完成
  • 五張 Apple 健身 App 截圖 → 七分鐘生成可執行 App
  • 定價:比前代旗艦 Opus 貴兩倍;Pro / Max / Team 訂閱含額度使用至 6/22
  • Mythos 曾挖出開源程式庫中藏了 16 年、從未被發現的安全漏洞
  • 下架命令依據:美國國家安全法規,禁對象含 Anthropic 外籍員工
  • Anthropic 公開反駁:政府僅有口頭證據,無公開技術依據
  • 三大下架猜測:①資安(官方說法)②算力吃緊(Fable 問世前 Opus 已頻繁降智)③行銷策略
  • 使用技巧:①拿掉舊模型的手把手指令補丁,只給目標;②先討論任務定義再執行;③Fable 當指揮官規劃,雜活交便宜模型
  • --

結論

結論

再強的 AI 工具都可能一夜消失,讓任何單一模型成為工作流瓶頸是最大的風險——永遠準備好可替換的備案。

完整解析

詳細

2026 年 6 月 9 日,Anthropic 發布了 Claude Fable。要理解 Fable 是什麼,得先從它的前身 Mythos 說起。Mythos 是 Anthropic 訓練出的一個「令人害怕」(官方文件用詞:frightening)等級模型,強到能在一個被全球工程師審視十幾年的開源程式庫中,挖出一個藏了十六年的安全漏洞。正因如此,Mythos 從未對外公開,只限量給少數資安防禦機構使用。Fable 的本質就是 Mythos,差別在於 Anthropic 為其加上了一層安全護欄,試圖鎖住最危險的攻擊性能力,做成一般用戶可以使用的公開版本。

Fable 的能力在多個測試上創下紀錄。SWE-bench Pro(業界標準的程式能力測驗)中,Fable 得分 80.3%,而 GPT-5.5 僅 58.6%,在模型世界中屬於碾壓級差距。Stripe 將其用於五千萬行程式碼的系統遷移,原本工程師估計需要兩個月的工作,Fable 一天就完成。然而 Fable 並非天下無敵,在 Automation Bench(模擬完全無人監管的真實商業流程)中,它的成功率只有 17%——這個數字雖然是全場最高,卻也揭示了它的根本限制:它無法從頭到尾獨立完成跨工具的複雜任務,仍然需要人類在旁邊把關。加上定價約為前代 Opus 的兩倍,而性能相近的 Gemini 3.5 Flash 價格只需四分之一,Fable 的性價比在大多數日常任務上是輸的。

影片作者在 Fable 存活的 72 小時內將其投入真實工作流——影片研究、寫稿、視覺編排全流程——並在 24 小時內燒掉了一整週 Claude Code 額度的 70%。他最有感的是 Fable 的視覺編排能力:過去用舊模型做影片畫面排版,排版跑位、間距錯亂的問題需要來回修多次,Fable 幾乎一次就到位,省去大量來回修改的時間成本。他也分享了三個使用技巧:第一,拿掉過去為舊模型寫的細節指令補丁,只給目標;第二,先餵 context 討論任務定義,確認方向後才讓模型執行;第三,把 Fable 當指揮官用於規劃拆解,瑣碎雜活交給較便宜的模型,最大化其判斷力的價值。

6 月 12 日禮拜五,Anthropic 收到美國政府依國家安全法規發出的命令:禁止所有外國人使用 Fable 與 Mythos,連 Anthropic 自己的外籍員工都不例外。由於 Anthropic 的員工、客戶、供應鏈遍布全球,要做到一個外國人都不能用,唯一辦法就是對所有人關閉。政府的核心理由是:有人找到方法繞過護欄——方法其實就是叫 Fable 讀 code base 然後找問題修問題,這和全世界工程師每天做的事毫無二致。護欄的結構性尷尬在此:它無法分辨你是在修自己的程式,還是在挖別人的漏洞,因為這本質上是同一個動作。Anthropic 公開反駁,指政府僅有口頭證據、無公開技術依據,且此能力是所有 coding 模型(包含 GPT)都具備的普遍功能,並非 Fable 獨有問題,但命令還是當下執行,模型立即下線。社群對下架真相的主流猜測有三:資安(官方說法)、算力吃緊(Fable 問世前 Opus 就已頻繁因算力不足降智,而政府命令恰好給了 Anthropic 一個體面台階)、以及行銷策略(「強到被政府查禁」本身就是最強廣告)。三個原因,作者認為可以同時成立。

---

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手?
16 min
AI 技術中文6月20日

Claude Cowork vs Codex: 誰才是更好的AI工作助手?

李厂长来了

  • 介面設計哲學不同:Codework 以標籤頁區分聊天、文書與程式碼三種模式,任務彼此隔離不混淆;Codex 則將所有功能整合在單一介面,減少切換成本,但頁面相對雜亂。
  • 第三方整合能力差距明顯:Codework 提供大量連接器並支援 Zapier 擴展,且可針對每個連接器精細設定讀寫權限(如 Gmail 只讀免確認、寫信需批准);Codex 的插件數量較少且缺乏同等級的權限控制機制。
  • 定時任務管理方式影響長期使用體驗:Codework 將同一自動化任務的歷史記錄歸類在同一條目下,便於追蹤;Codex 每次執行都獨立列出,隨任務增多左側欄會越來越臃腫,不利於長期管理。
我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026
編輯精選
28 min
AI 技術中文6月20日

我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026

EngineerGary

  • Tokenomics 重新定義 AI 工廠價值:黃仁勛將所有輸出重新框架為 Token = Revenue,傳統工廠生產實體商品,AI 工廠改為生產 Token;對製造端而言,目標是以最低成本產生最多 Token,實現每投入 1 元帶回 3–5 元回報的商業邏輯。
  • 開源策略是市場放大器而非讓利:NVIDIA 釋出 Cosmos 3、Apomile 3 等開源模型,以及通用人型機器人,目的是降低新創進入自動駕駛、World Model、Physical AI 的門檻,擴大整體生態系規模,最終帶動更多算力與服務需求(「The more you buy, the more you earn」)。
  • Deal to Delivery Agent 解決中小企業流程瓶頸:Gary 團隊識別出企業收到客戶需求後,需跨工具手動完成報價、開票、GitHub issue、通知等重複性操作是最大效率殺手;Agent 自動拆解商機、建立 ERP 記錄並推送 Telegram 通知,人類只需在 Draft 狀態下做最終 Review 確認。
黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備
編輯精選
30 min
AI 技術中文6月20日

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備

Coco哥

  • QNX 擁有機器人 OS 三大不可替代技術門檻
  • Windows 響應延遲 200 毫秒,Linux 一旦核心崩潰全部失效,而 QNX 具備毫秒級即時決策、ISO 26262 ASIL-D 與 IEC 61508 SIL-3 最高安全認證,以及微型內核獨立架構(單一模組崩潰不影響其餘系統),三項條件同時達標,現階段競爭對手均未能複製。
  • 40 年護城河非短期可追趕