Claude Fable 5 Made This Entire Video By Itself.
三句話摘要
Anthropic 推出頂級 Claude Opus 5,本影片本身即由 Claude 全自動生成,展示其 Long Horizon 任務執行能力。 Claude Opus 5 的真正價值不在基準分數,而在於它能將「下一個 Prompt,走開,回來影片做好了」這件事變成現實。 Mythos Class 模型首度開放:Claude Opus 5 是首個以「Mythos Class」定位並向一般付費用戶開放的頂級模型,過去此等級僅供受審核的安全夥伴使用,代表 Anthropic 正式將最強能力普及化。
重點整理
重點- 1
Mythos Class 模型首度開放:Claude Opus 5 是首個以「Mythos Class」定位並向一般付費用戶開放的頂級模型,過去此等級僅供受審核的安全夥伴使用,代表 Anthropic 正式將最強能力普及化。
- 2
Long Horizon Focus 是核心突破:模型支援數百萬 Input Tokens 的上下文,並具備基礎記憶寫入能力,使其能在複雜長流程任務中持續追蹤狀態,而非依賴外部支援工具。
- 3
視覺理解達到實用級別:僅憑畫面截圖即可重建網頁應用程式,並能在無地圖、無輔助器的條件下遊玩 Pokemon FireRed,老版 Claude 模型則需要完整支援框架才能做到同樣的事。
- 4
影片本身即 Proof of Concept:整個製作流程(腳本→配音→Avatar→剪輯→動畫→QA)由 Claude 端對端自動完成,創作者僅提供一個初始目標 Prompt,展示了 Agentic 工作流的實際落地深度。
實用技巧與重點
乾貨- 定價:Input $10 / 百萬 Token,Output $50 / 百萬 Token
- Stripe 案例:數月工程 → 一天
- Ruby Code Base:50 萬行,一天遷移 vs. 團隊兩個月
- Slay the Spire:達到最終章次數為 Opus 4.8 的 3 倍
- 配音工具:11 Labs(以創作者真實影片訓練的聲音系統)
- Avatar 工具:HeyGen,使用 Avatar 5 模型(最新動態引擎)
- Avatar API 當時不支援直接呼叫,Claude 用 Playwright 驅動 HeyGen 網頁介面自動提交
- 剪輯工具:FFmpeg(Claude 直接寫指令合併 Clip)
- 動畫工具:HTML + GSAP,在 HyperFrames 平台製作
- 音訊分段策略:每段約 1 分鐘,避免長段輸出音量不穩問題
- QA 流程:Claude 截圖每個場景 → 視覺測試 → 不過關則自動修正重建
結論
結論“Claude Opus 5 的真正價值不在基準分數,而在於它能將「下一個 Prompt,走開,回來影片做好了」這件事變成現實。”
完整解析
詳細這週 Anthropic 正式推出 Claude Opus 5,這是首個以「Mythos Class」定位並向所有付費方案用戶開放的頂級模型。過去這個等級僅開放給受審核的安全合作夥伴(Vetted Security Partners),此次開放意義重大。在官方公布的基準測試中,Opus 5 幾乎在每個評估項目都表現出色,其中最受關注的三個面向是:程式碼能力、視覺理解,以及 Long Horizon Focus。
程式碼能力方面,Stripe 公開表示 Claude Opus 5 將原本需要數個月的工程工作縮短為一天;另一個案例是 50 萬行的 Ruby Code Base,遷移工作量等同一整個工程團隊耗費兩個月,而 Opus 5 單日內便完成。視覺理解方面,模型可以僅憑截圖重建完整的網頁應用程式,並能在沒有地圖、沒有輔助器的條件下遊玩 Pokemon FireRed,而舊版 Claude 模型則需要完整的支援工具才能達到相同效果。Long Horizon Focus 則是最具潛力的能力:模型支援數百萬 Input Tokens 的上下文,並具備基礎記憶寫入功能,在測試 Slay the Spire 時,其達到最終章的次數是 Opus 4.8 的三倍。定價為 Input $10 / 百萬 Token、Output $50 / 百萬 Token。
而這支影片本身,就是這些能力最直接的示範。創作者只寫了一個 Prompt——「去健身房,回來時影片已經做好」——然後 Claude 全程接手。流程如下:Claude 先讀取 Anthropic 的官方公告,以創作者本人的語氣與節奏寫出整份腳本;接著將腳本傳送至 11 Labs,呼叫以創作者真實影片訓練的聲音模型生成配音,但由於長段輸出會導致音量不穩,Claude 主動將腳本切成每段約一分鐘的區塊分別生成再合併。
Avatar 部分,每段音訊送入 HeyGen 搭配最新的 Avatar 5 動態引擎生成口型同步影像。由於 HeyGen 的 Avatar 5 當時尚未開放 API,Claude 直接用 Playwright 自動駕駛 HeyGen 網頁介面,逐段提交、下載影片。有了所有的原始 Avatar Clip 之後,Claude 用 FFmpeg 指令將片段合併剪輯,再以 HTML + GSAP 在 HyperFrames 平台製作所有動態文字與圖形動畫——每個動畫都是真實可執行的程式碼。最後是 QA 環節:Claude 對每個場景截圖,透過視覺測試驗證結果,凡是不通過的一律自動修正並重新生成,直到全部通過,才輸出最終完整的 YouTube 影片。
關鍵時刻
Pipeline v2帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。
事實查核
Pipeline v2說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。


