KeyFrame

Claude Fable 5 首发实测,真是太烧了。。完爆 GPT 5.5!#ai编程 #ai #claude #程序员 #编程

Programmer Fish Skin·6月10日週三·9 min中文

三句話摘要

Claude Fable 5 實測報告:以兩輪 AI 編程任務對比 GPT-5.5 與 Opus 4.8,驗證其「最貴但最能交付」的定位。 --- Fable 5 是目前 AI 編程中「唯一能一次交付可用產品」的模型,但其成本是競品的 3–8 倍,適合預算充足、對交付品質要求極高的場景,而非所有人的日常首選。 安全護欄設計決定了模型的受眾邊界:Fable 5 內建安全分類器,遇到網路安全、生化或模型蒸餾等敏感請求時會自動降級至 Opus 4.8;Mythos 5 移除護欄,僅開放給官方審核過的機構,普通用戶無法取得。

重點整理

重點
  • 1

    安全護欄設計決定了模型的受眾邊界:Fable 5 內建安全分類器,遇到網路安全、生化或模型蒸餾等敏感請求時會自動降級至 Opus 4.8;Mythos 5 移除護欄,僅開放給官方審核過的機構,普通用戶無法取得。

  • 2

    任務越長越複雜,Fable 5 的優勢越明顯:官方以 Stripe 5000 萬行 Ruby 代碼庫為例,Fable 5 一天完成了團隊原本需要兩個月的遷移工作;短平快的 demo 無法反映真實差距,長程任務才是分水嶺。

  • 3

    Fable 5 的高成本源於它真的願意「多做」:它是三個模型中唯一進行終端互動式測試的,花費大量輪次在 TUI 交互調試上,而這些額外投入正是它能交付可用產品的根本原因。

  • 4

    三個模型呈現明確差異化定位:GPT-5.5 追求速度與成本效益;Opus 4.8 兼顧代碼品質與成本;Fable 5 追求極致交付品質,代價是最高的費用。

  • 5

    --

實用技巧與重點

乾貨
  • 定價
  • Fable 5:輸入 $10 / 百萬 token,輸出 $50 / 百萬 token
  • 是 Opus 4.8 的 2 倍,DeepSeek V4 的約 50 倍
  • 比先前的 Mythos Preview 便宜超過一半
  • 模型版本
  • Claude Fable 5:公開版,含安全分類器,敏感請求降級至 Opus 4.8
  • Mythos 5:完整版,無護欄,僅供官方審核的網路安全機構與少數生物研究人員
  • 測試案例 1 — TaskFlow 全棧任務
  • 工具:Cursor(已第一時間接入 Fable 5)
  • 包含 7 個功能需求,3 個模型相同 Prompt,全開 High thinking,零人工干預
  • Fable 5:唯一零修改通過 TypeScript 編譯、後端一次啟動成功、全部 API 測試通過
  • Opus 4.8:代碼品質較高但 UI 較樸素
  • GPT-5.5:速度最快,但任務列標題出現英文,細節缺失
  • 測試案例 2 — 重構 Claude Code(Yupi Code)
  • 材料:Claude Code 洩露的 50 萬行工業級 Agent 源碼
  • 任務:自主分析架構,從零重構可在終端運行的命令列 AI 編程助手
  • Fable 5:直接讀取本地 Claude 配置,複用 DeepSeek 模型,無需填 API Key,一次交付可用,普通對話 / Agent 模式 / 工具調用全部正常
  • Opus 4.8:透過 Mock Server 跑通測試,但實際運行需要 Anthropic API Key,UI 顯示異常
  • GPT-5.5:速度最快,但同樣需要 API Key,介面簡陋,Read 工具直接報錯
  • 成本對比(單次長程任務)
  • Fable 5:約人民幣 200 元
  • Opus 4.8:約 Fable 5 的 1/3
  • GPT-5.5:約 Fable 5 的 1/8
  • 真實案例數據
  • Stripe:5000 萬行 Ruby 代碼庫,Fable 5 一天完成原本需要 2 個月的遷移
  • 功能對比矩陣關鍵項目(Fable 5 獨有)
  • Ink TUI 完整實現
  • 上下文壓縮
  • 自動複用本地配置
  • --

結論

結論

Fable 5 是目前 AI 編程中「唯一能一次交付可用產品」的模型,但其成本是競品的 3–8 倍,適合預算充足、對交付品質要求極高的場景,而非所有人的日常首選。

完整解析

詳細

Claude Fable 5 的發布背景建立在一個清晰的市場定位上:它與 Mythos 5 共享同一個底層模型,能力完全一致,差異只在安全護欄的鬆緊程度。Fable 5 面向一般用戶,遇到網路安全、生化研究或模型蒸餾等敏感請求時,系統會自動降級至 Opus 4.8 並給出提示;Mythos 5 則拆除了所有護欄,僅開放給通過官方審核的機構。定價方面,Fable 5 每百萬輸入 token $10、輸出 $50,是 Opus 4.8 的兩倍,也是目前主流模型中定價最高的,儘管官方強調這已比前一個 Mythos Preview 版本便宜了超過一半。

為了驗證「貴得值不值」,測試者設計了兩輪對比:第一輪是開發含 7 個功能需求的全棧任務管理看板 TaskFlow,測試 UI 審美、編碼能力與工程可靠性。三個模型使用完全相同的 Prompt,全程開 High thinking 且零人工干預。結果顯示,UI 風格上 Fable 5 配色協調、狀態分區清晰;工程品質上,Fable 5 是唯一一次通過 TypeScript 編譯、後端一次啟動成功、所有 API 測試一次通過的模型,真正做到開箱即用。GPT-5.5 雖然速度最快,但細節上出現英文標題等問題;Opus 4.8 排版工整但 UI 較為樸素。

第二輪測試才是真正的壓力測試。測試者以 Claude Code 洩露的 50 萬行工業級 Agent 源碼為材料,要求三個模型自主分析架構並從零重構一個能在終端實際運行的命令列 AI 編程助手「Yupi Code」。Opus 4.8 透過 Mock Server 完成測試流程,自主驗證層次最多,但實際運行需要 Anthropic 的 API Key,且修復後 UI 顯示仍有問題;GPT-5.5 完成速度最快,但同樣卡在 API Key 需求上,介面極為簡陋,基本的 Read 工具甚至直接報錯。Fable 5 則直接讀取了測試者本地的 Claude 配置,自動複用已設定好的 DeepSeek 模型,無需手動填入任何 Key,交付後普通對話、Agent 模式、工具調用全部正常,體驗與原版 Claude Code 幾乎一致。

最終的成本揭露令人驚訝:這一次長程任務,Fable 5 的費用約人民幣 200 元,是 Opus 4.8 的 3 倍、GPT-5.5 的 8 倍。高費用的主要原因是思考 token 的消耗,以及 Fable 5 在 TUI 互動調試上投入了大量輪次。然而,正是這些「多做」的輪次,讓它成為三個模型中唯一交付可用產品的選手。從可視化分析報告來看,Fable 5 在驗證深度與實測可用性上遙遙領先,Opus 4.8 在工程代碼品質上略勝一籌,GPT-5.5 則全面墊底。測試者的建議是:GPT-5.5 適合追求速度與成本的場景,Opus 4.8 適合兼顧品質與成本的日常需求,Fable 5 則適合需要極致交付品質、且預算充足的任務,最貴的不一定是最適合你的。

---

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手?
16 min
AI 技術中文6月20日

Claude Cowork vs Codex: 誰才是更好的AI工作助手?

李厂长来了

  • 介面設計哲學不同:Codework 以標籤頁區分聊天、文書與程式碼三種模式,任務彼此隔離不混淆;Codex 則將所有功能整合在單一介面,減少切換成本,但頁面相對雜亂。
  • 第三方整合能力差距明顯:Codework 提供大量連接器並支援 Zapier 擴展,且可針對每個連接器精細設定讀寫權限(如 Gmail 只讀免確認、寫信需批准);Codex 的插件數量較少且缺乏同等級的權限控制機制。
  • 定時任務管理方式影響長期使用體驗:Codework 將同一自動化任務的歷史記錄歸類在同一條目下,便於追蹤;Codex 每次執行都獨立列出,隨任務增多左側欄會越來越臃腫,不利於長期管理。
我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026
編輯精選
28 min
AI 技術中文6月20日

我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026

EngineerGary

  • Tokenomics 重新定義 AI 工廠價值:黃仁勛將所有輸出重新框架為 Token = Revenue,傳統工廠生產實體商品,AI 工廠改為生產 Token;對製造端而言,目標是以最低成本產生最多 Token,實現每投入 1 元帶回 3–5 元回報的商業邏輯。
  • 開源策略是市場放大器而非讓利:NVIDIA 釋出 Cosmos 3、Apomile 3 等開源模型,以及通用人型機器人,目的是降低新創進入自動駕駛、World Model、Physical AI 的門檻,擴大整體生態系規模,最終帶動更多算力與服務需求(「The more you buy, the more you earn」)。
  • Deal to Delivery Agent 解決中小企業流程瓶頸:Gary 團隊識別出企業收到客戶需求後,需跨工具手動完成報價、開票、GitHub issue、通知等重複性操作是最大效率殺手;Agent 自動拆解商機、建立 ERP 記錄並推送 Telegram 通知,人類只需在 Draft 狀態下做最終 Review 確認。
黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備
編輯精選
30 min
AI 技術中文6月20日

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備

Coco哥

  • QNX 擁有機器人 OS 三大不可替代技術門檻
  • Windows 響應延遲 200 毫秒,Linux 一旦核心崩潰全部失效,而 QNX 具備毫秒級即時決策、ISO 26262 ASIL-D 與 IEC 61508 SIL-3 最高安全認證,以及微型內核獨立架構(單一模組崩潰不影響其餘系統),三項條件同時達標,現階段競爭對手均未能複製。
  • 40 年護城河非短期可追趕