KeyFrame

Codex保姆級完整教學:從入門到進階,自動生成內容、網頁、影片和App,快速學會指揮你的超級AI Agent #chatgpt #codex

學長Ethan·5月4日週一·29 min中文

三句話摘要

OpenAI Codex 桌面超級 Agent 完整教學:從安裝設定到多工並行,讓 AI 真正替你動手完成任務。 --- Codex 的核心價值不在於它有多聰明,而在於透過 agent.md + Skill + Plugin 的組合,它能以標準化、可並行、無需人工監督的方式替你「交付結果」,而不只是「給出建議」。 1. Codex 與一般 AI 聊天工具的根本差異

重點整理

重點
  • 1

    1. Codex 與一般 AI 聊天工具的根本差異

  • 2

    現有的 ChatGPT、Gemini、Claude 網頁端是「給建議」的工具,使用者還是要自己動手;Codex 安裝在本機,可直接讀寫本地文件、操控外部服務,是真正「替你執行」的 Agent。

  • 3

    2. agent.md 是 Codex 的核心配置文件

  • 4

    這份放在 Project 根目錄的文件相當於 AI 員工的入職手冊,定義身份(你是誰、受眾是誰)、輸出語言格式、工作原則,Codex 每次開始任務前都會先讀取,直接影響產出品質。

  • 5

    3. Plugin 擴充外部工具整合能力

  • 6

    Plugin 不定義工作步驟,而是接入外部軟體(Gmail、Google Calendar、Canva、Figma、GitHub、資料庫、吉夢/LibTV 的 CLI 等),讓 Codex 能跨平台操作,這是 Claude 桌面端目前沒有的功能。

  • 7

    4. Skill 封裝 SOP 確保產出品質一致

  • 8

    Skill 將複雜的標準化流程寫成 Markdown 文件存入 Project 資料夾,往後只需輸入 `/skill名稱` 即可觸發,每次產出的格式與品質標準完全相同,是批量內容生產的關鍵機制。

  • 9

    --

實用技巧與重點

乾貨
  • 工具與平台
  • Codex 桌面 App(Google 搜尋「Codex App」下載)
  • 登入方式:ChatGPT 帳號 或 OpenAI API Key(支援第三方中轉 API)
  • 可調用模型:GPT-5.5、其他第三方大型語言模型
  • Plugin:Computer Use、Browser Use、Spreadsheets、Presentation、Vercel、Superpowers、GitHub、Canva、Figma、Gmail、Google Calendar、Google Drive、Build iOS App、Build Web App、Build macOS App
  • 視頻 CLI:吉夢(Jimeng)CLI、LibTV CLI(使用 Seedance 2.0 模型)
  • 圖片生成:ChatGPT Image 2(GPT Image 2)
  • iOS 模擬器:需預先安裝 Xcode
  • 具體數字與效益
  • 智慧等級建議:選「高」或「超高」Effort 等級
  • 速度選項:標準 / 快速 / 1.5 倍速
  • 任務壓縮效果:原本各需 2-3 小時的工作 → Agent 並行處理壓縮至 20-30 分鐘
  • HTML 視覺化報告結構:含 13 個區塊、5 種視覺風格選項
  • IG 文案 Skill 規格範例:繁體中文、口語化、每則限 150 字、結尾需有行動呼籲(CTA)
  • 步驟與流程
  • 下載並安裝 Codex 桌面 App → 用 ChatGPT 帳號登入
  • 新增 Project(建立專屬工作資料夾)
  • 輸入提示詞讓 Codex 自動生成 agent.md(丟入既有提示詞與文件參考)
  • 安裝所需 Plugin(點擊「安裝外掛程式」→「在聊天中試用」)
  • 建立第一個 Skill:描述功能需求 → 調用 `skill creator` → 自動生成 `.md` 存入 Project
  • Fork Chat(分叉功能):點選對話框 → 選「分叉到本機」→ 並行處理不同任務
  • 自動化排程:新增自動化 → 設定時間(如每天早上 10 點)→ 指定任務(如整理昨日工作成新 Skill)
  • agent.md 應包含的內容
  • 你是誰(身份、頻道定位、受眾畫像)
  • 輸出語言與格式(如:繁體中文、務實客觀、不拐彎抹角)
  • 工作原則(如:執行前先列計劃、完成後報告生成文件清單)
  • 根目錄命名規範(agent.md / memory / content / workflow / sandbox)
  • Codex vs Claude 桌面端主要差異
  • | 項目 | Codex | Claude 桌面端 |
  • |------|-------|-------------|
  • | Plugin 外掛整合 | 有(視覺化安裝) | 無(需用 CLI 方式) |
  • | Skill 視覺化管理 | 有介面展示 | 有但介面較簡 |
  • | 多工並行對話框 | 有(Fork Chat) | 無 |
  • | 自動化排程 | 有(類似 Routine/Schedule) | 部分支援 |
  • --

結論

結論

Codex 的核心價值不在於它有多聰明,而在於透過 agent.md + Skill + Plugin 的組合,它能以標準化、可並行、無需人工監督的方式替你「交付結果」,而不只是「給出建議」。

完整解析

詳細

現有的 AI 工具如 ChatGPT 或 Gemini 的使用模式,本質上是「問答循環」——使用者問,AI 給建議,但實際執行還是靠人。OpenAI 推出的 Codex 桌面 App 試圖打破這個模式:它安裝在使用者的本機電腦上,能直接讀寫本地文件、連接外部服務(Gmail、Google Calendar、Canva、Figma 等),並且可以在背景同時執行多個複雜任務,使用者去做自己的事,回來任務就已完成。這對內容創作者與小型企業主而言,代表著一個根本性的工作模式轉變。

安裝與設定方面,Codex 提供 ChatGPT 帳號直接登入,也支援 OpenAI API Key 或第三方中轉 API,並可調用 GPT-5.5 以外的第三方模型。介面分為左側功能選單、中間對話區、右側預覽區三大區塊,對話框下方可設定模型型號、處理速度(標準 / 快速 / 1.5 倍速),以及 Effort 智慧等級(建議選「高」或「超高」)。真正讓 Codex 發揮最大效用的關鍵有兩件事:一是建立 Project 資料夾,二是在根目錄放置 agent.md 文件。agent.md 是 AI 員工的入職手冊,定義使用者身份、受眾畫像、輸出語言格式與工作原則,Codex 每次開始任務前都會先讀取這份文件。建議透過對話讓 Codex 自動根據你既有的提示詞與文件生成這份文件,並設定每日早上定時自動優化更新。

在功能層次上,Codex 提供兩種核心擴充機制。Plugin(外掛程式)負責接入外部工具:Computer Use 可操控整台電腦、Browser Use 可控制瀏覽器、Gmail Plugin 可讀取與回覆郵件、Canva Plugin 可直接把生成的圖片導入 Canva 後台編輯,吉夢(Jimeng)與 LibTV 的 CLI 工具則可讓 Codex 直接生成影片片段。Skill(技能)則是把重複性 SOP 封裝成 Markdown 文件,例如「IG 文案 Skill:繁體中文、口語化、每則 150 字、結尾有 CTA」,往後只需輸入 `/ig文案` 指令加上主題,Codex 便會按標準格式產出,品質完全一致。兩者的差異在於:Plugin 解決「用什麼工具」的問題,Skill 解決「怎麼做事」的問題。

實際示範中,講者展示了多條並行工作流:輸入一張穿搭分鏡圖 + 一句提示詞,Codex 調用 LibTV CLI 的 Seedance 2.0 模型生成完整 Vlog 影片片段並拼接成片;輸入一張音樂播放器設計草圖,透過 Build iOS App Plugin 完整開發出可在 Xcode 模擬器上運行的 iOS App,且多巴胺配色風格隨歌曲切換動態更換;調用 info summary Skill 生成含 13 個區塊的視覺化 HTML 報告,選擇風格後即時渲染。這些任務若逐一手動完成各需 2-3 小時,而 Codex 透過 Fork Chat(分叉功能)開啟多個並行對話框,可將所有任務壓縮至 20-30 分鐘內同步完成。

---

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手?
16 min
AI 技術中文6月20日

Claude Cowork vs Codex: 誰才是更好的AI工作助手?

李厂长来了

  • 介面設計哲學不同:Codework 以標籤頁區分聊天、文書與程式碼三種模式,任務彼此隔離不混淆;Codex 則將所有功能整合在單一介面,減少切換成本,但頁面相對雜亂。
  • 第三方整合能力差距明顯:Codework 提供大量連接器並支援 Zapier 擴展,且可針對每個連接器精細設定讀寫權限(如 Gmail 只讀免確認、寫信需批准);Codex 的插件數量較少且缺乏同等級的權限控制機制。
  • 定時任務管理方式影響長期使用體驗:Codework 將同一自動化任務的歷史記錄歸類在同一條目下,便於追蹤;Codex 每次執行都獨立列出,隨任務增多左側欄會越來越臃腫,不利於長期管理。
我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026
編輯精選
28 min
AI 技術中文6月20日

我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026

EngineerGary

  • Tokenomics 重新定義 AI 工廠價值:黃仁勛將所有輸出重新框架為 Token = Revenue,傳統工廠生產實體商品,AI 工廠改為生產 Token;對製造端而言,目標是以最低成本產生最多 Token,實現每投入 1 元帶回 3–5 元回報的商業邏輯。
  • 開源策略是市場放大器而非讓利:NVIDIA 釋出 Cosmos 3、Apomile 3 等開源模型,以及通用人型機器人,目的是降低新創進入自動駕駛、World Model、Physical AI 的門檻,擴大整體生態系規模,最終帶動更多算力與服務需求(「The more you buy, the more you earn」)。
  • Deal to Delivery Agent 解決中小企業流程瓶頸:Gary 團隊識別出企業收到客戶需求後,需跨工具手動完成報價、開票、GitHub issue、通知等重複性操作是最大效率殺手;Agent 自動拆解商機、建立 ERP 記錄並推送 Telegram 通知,人類只需在 Draft 狀態下做最終 Review 確認。
黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備
編輯精選
30 min
AI 技術中文6月20日

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備

Coco哥

  • QNX 擁有機器人 OS 三大不可替代技術門檻
  • Windows 響應延遲 200 毫秒,Linux 一旦核心崩潰全部失效,而 QNX 具備毫秒級即時決策、ISO 26262 ASIL-D 與 IEC 61508 SIL-3 最高安全認證,以及微型內核獨立架構(單一模組崩潰不影響其餘系統),三項條件同時達標,現階段競爭對手均未能複製。
  • 40 年護城河非短期可追趕