KeyFrame

Claude Fable 5 Made This Entire Video By Itself.

Nate Herk·6月12日週五·5 min英文

三句話摘要

Anthropic 推出頂級 Claude Opus 5,本影片本身即由 Claude 全自動生成,展示其 Long Horizon 任務執行能力。 Claude Opus 5 的真正價值不在基準分數,而在於它能將「下一個 Prompt,走開,回來影片做好了」這件事變成現實。 Mythos Class 模型首度開放:Claude Opus 5 是首個以「Mythos Class」定位並向一般付費用戶開放的頂級模型,過去此等級僅供受審核的安全夥伴使用,代表 Anthropic 正式將最強能力普及化。

重點整理

重點
  • 1

    Mythos Class 模型首度開放:Claude Opus 5 是首個以「Mythos Class」定位並向一般付費用戶開放的頂級模型,過去此等級僅供受審核的安全夥伴使用,代表 Anthropic 正式將最強能力普及化。

  • 2

    Long Horizon Focus 是核心突破:模型支援數百萬 Input Tokens 的上下文,並具備基礎記憶寫入能力,使其能在複雜長流程任務中持續追蹤狀態,而非依賴外部支援工具。

  • 3

    視覺理解達到實用級別:僅憑畫面截圖即可重建網頁應用程式,並能在無地圖、無輔助器的條件下遊玩 Pokemon FireRed,老版 Claude 模型則需要完整支援框架才能做到同樣的事。

  • 4

    影片本身即 Proof of Concept:整個製作流程(腳本→配音→Avatar→剪輯→動畫→QA)由 Claude 端對端自動完成,創作者僅提供一個初始目標 Prompt,展示了 Agentic 工作流的實際落地深度。

實用技巧與重點

乾貨
  • 定價:Input $10 / 百萬 Token,Output $50 / 百萬 Token
  • Stripe 案例:數月工程 → 一天
  • Ruby Code Base:50 萬行,一天遷移 vs. 團隊兩個月
  • Slay the Spire:達到最終章次數為 Opus 4.8 的 3 倍
  • 配音工具:11 Labs(以創作者真實影片訓練的聲音系統)
  • Avatar 工具:HeyGen,使用 Avatar 5 模型(最新動態引擎)
  • Avatar API 當時不支援直接呼叫,Claude 用 Playwright 驅動 HeyGen 網頁介面自動提交
  • 剪輯工具:FFmpeg(Claude 直接寫指令合併 Clip)
  • 動畫工具:HTML + GSAP,在 HyperFrames 平台製作
  • 音訊分段策略:每段約 1 分鐘,避免長段輸出音量不穩問題
  • QA 流程:Claude 截圖每個場景 → 視覺測試 → 不過關則自動修正重建

結論

結論

Claude Opus 5 的真正價值不在基準分數,而在於它能將「下一個 Prompt,走開,回來影片做好了」這件事變成現實。

完整解析

詳細

這週 Anthropic 正式推出 Claude Opus 5,這是首個以「Mythos Class」定位並向所有付費方案用戶開放的頂級模型。過去這個等級僅開放給受審核的安全合作夥伴(Vetted Security Partners),此次開放意義重大。在官方公布的基準測試中,Opus 5 幾乎在每個評估項目都表現出色,其中最受關注的三個面向是:程式碼能力、視覺理解,以及 Long Horizon Focus。

程式碼能力方面,Stripe 公開表示 Claude Opus 5 將原本需要數個月的工程工作縮短為一天;另一個案例是 50 萬行的 Ruby Code Base,遷移工作量等同一整個工程團隊耗費兩個月,而 Opus 5 單日內便完成。視覺理解方面,模型可以僅憑截圖重建完整的網頁應用程式,並能在沒有地圖、沒有輔助器的條件下遊玩 Pokemon FireRed,而舊版 Claude 模型則需要完整的支援工具才能達到相同效果。Long Horizon Focus 則是最具潛力的能力:模型支援數百萬 Input Tokens 的上下文,並具備基礎記憶寫入功能,在測試 Slay the Spire 時,其達到最終章的次數是 Opus 4.8 的三倍。定價為 Input $10 / 百萬 Token、Output $50 / 百萬 Token。

而這支影片本身,就是這些能力最直接的示範。創作者只寫了一個 Prompt——「去健身房,回來時影片已經做好」——然後 Claude 全程接手。流程如下:Claude 先讀取 Anthropic 的官方公告,以創作者本人的語氣與節奏寫出整份腳本;接著將腳本傳送至 11 Labs,呼叫以創作者真實影片訓練的聲音模型生成配音,但由於長段輸出會導致音量不穩,Claude 主動將腳本切成每段約一分鐘的區塊分別生成再合併。

Avatar 部分,每段音訊送入 HeyGen 搭配最新的 Avatar 5 動態引擎生成口型同步影像。由於 HeyGen 的 Avatar 5 當時尚未開放 API,Claude 直接用 Playwright 自動駕駛 HeyGen 網頁介面,逐段提交、下載影片。有了所有的原始 Avatar Clip 之後,Claude 用 FFmpeg 指令將片段合併剪輯,再以 HTML + GSAP 在 HyperFrames 平台製作所有動態文字與圖形動畫——每個動畫都是真實可執行的程式碼。最後是 QA 環節:Claude 對每個場景截圖,透過視覺測試驗證結果,凡是不通過的一律自動修正並重新生成,直到全部通過,才輸出最終完整的 YouTube 影片。

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手?
16 min
AI 技術中文6月20日

Claude Cowork vs Codex: 誰才是更好的AI工作助手?

李厂长来了

  • 介面設計哲學不同:Codework 以標籤頁區分聊天、文書與程式碼三種模式,任務彼此隔離不混淆;Codex 則將所有功能整合在單一介面,減少切換成本,但頁面相對雜亂。
  • 第三方整合能力差距明顯:Codework 提供大量連接器並支援 Zapier 擴展,且可針對每個連接器精細設定讀寫權限(如 Gmail 只讀免確認、寫信需批准);Codex 的插件數量較少且缺乏同等級的權限控制機制。
  • 定時任務管理方式影響長期使用體驗:Codework 將同一自動化任務的歷史記錄歸類在同一條目下,便於追蹤;Codex 每次執行都獨立列出,隨任務增多左側欄會越來越臃腫,不利於長期管理。
我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026
編輯精選
28 min
AI 技術中文6月20日

我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026

EngineerGary

  • Tokenomics 重新定義 AI 工廠價值:黃仁勛將所有輸出重新框架為 Token = Revenue,傳統工廠生產實體商品,AI 工廠改為生產 Token;對製造端而言,目標是以最低成本產生最多 Token,實現每投入 1 元帶回 3–5 元回報的商業邏輯。
  • 開源策略是市場放大器而非讓利:NVIDIA 釋出 Cosmos 3、Apomile 3 等開源模型,以及通用人型機器人,目的是降低新創進入自動駕駛、World Model、Physical AI 的門檻,擴大整體生態系規模,最終帶動更多算力與服務需求(「The more you buy, the more you earn」)。
  • Deal to Delivery Agent 解決中小企業流程瓶頸:Gary 團隊識別出企業收到客戶需求後,需跨工具手動完成報價、開票、GitHub issue、通知等重複性操作是最大效率殺手;Agent 自動拆解商機、建立 ERP 記錄並推送 Telegram 通知,人類只需在 Draft 狀態下做最終 Review 確認。
黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備
編輯精選
30 min
AI 技術中文6月20日

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備

Coco哥

  • QNX 擁有機器人 OS 三大不可替代技術門檻
  • Windows 響應延遲 200 毫秒,Linux 一旦核心崩潰全部失效,而 QNX 具備毫秒級即時決策、ISO 26262 ASIL-D 與 IEC 61508 SIL-3 最高安全認證,以及微型內核獨立架構(單一模組崩潰不影響其餘系統),三項條件同時達標,現階段競爭對手均未能複製。
  • 40 年護城河非短期可追趕