Codex保姆級完整教學：從入門到進階，自動生成內容、網頁、影片和App，快速學會指揮你的超級AI Agent #chatgpt #codex

學長Ethan·5月4日週一·29 min中文

三句話摘要

OpenAI Codex 桌面超級 Agent 完整教學：從安裝設定到多工並行，讓 AI 真正替你動手完成任務。 --- Codex 的核心價值不在於它有多聰明，而在於透過 agent.md + Skill + Plugin 的組合，它能以標準化、可並行、無需人工監督的方式替你「交付結果」，而不只是「給出建議」。 1. Codex 與一般 AI 聊天工具的根本差異

重點整理

重點

1
1. Codex 與一般 AI 聊天工具的根本差異
2
現有的 ChatGPT、Gemini、Claude 網頁端是「給建議」的工具，使用者還是要自己動手；Codex 安裝在本機，可直接讀寫本地文件、操控外部服務，是真正「替你執行」的 Agent。
3
2. agent.md 是 Codex 的核心配置文件
4
這份放在 Project 根目錄的文件相當於 AI 員工的入職手冊，定義身份（你是誰、受眾是誰）、輸出語言格式、工作原則，Codex 每次開始任務前都會先讀取，直接影響產出品質。
5
3. Plugin 擴充外部工具整合能力
6
Plugin 不定義工作步驟，而是接入外部軟體（Gmail、Google Calendar、Canva、Figma、GitHub、資料庫、吉夢/LibTV 的 CLI 等），讓 Codex 能跨平台操作，這是 Claude 桌面端目前沒有的功能。
7
4. Skill 封裝 SOP 確保產出品質一致
8
Skill 將複雜的標準化流程寫成 Markdown 文件存入 Project 資料夾，往後只需輸入 `/skill名稱` 即可觸發，每次產出的格式與品質標準完全相同，是批量內容生產的關鍵機制。
9
--

實用技巧與重點

乾貨

工具與平台
Codex 桌面 App（Google 搜尋「Codex App」下載）
登入方式：ChatGPT 帳號或 OpenAI API Key（支援第三方中轉 API）
可調用模型：GPT-5.5、其他第三方大型語言模型
Plugin：Computer Use、Browser Use、Spreadsheets、Presentation、Vercel、Superpowers、GitHub、Canva、Figma、Gmail、Google Calendar、Google Drive、Build iOS App、Build Web App、Build macOS App
視頻 CLI：吉夢（Jimeng）CLI、LibTV CLI（使用 Seedance 2.0 模型）
圖片生成：ChatGPT Image 2（GPT Image 2）
iOS 模擬器：需預先安裝 Xcode
具體數字與效益
智慧等級建議：選「高」或「超高」Effort 等級
速度選項：標準 / 快速 / 1.5 倍速
任務壓縮效果：原本各需 2-3 小時的工作 → Agent 並行處理壓縮至 20-30 分鐘
HTML 視覺化報告結構：含 13 個區塊、5 種視覺風格選項
IG 文案 Skill 規格範例：繁體中文、口語化、每則限 150 字、結尾需有行動呼籲（CTA）
步驟與流程
下載並安裝 Codex 桌面 App → 用 ChatGPT 帳號登入
新增 Project（建立專屬工作資料夾）
輸入提示詞讓 Codex 自動生成 agent.md（丟入既有提示詞與文件參考）
安裝所需 Plugin（點擊「安裝外掛程式」→「在聊天中試用」）
建立第一個 Skill：描述功能需求 → 調用 `skill creator` → 自動生成 `.md` 存入 Project
Fork Chat（分叉功能）：點選對話框 → 選「分叉到本機」→ 並行處理不同任務
自動化排程：新增自動化 → 設定時間（如每天早上 10 點）→ 指定任務（如整理昨日工作成新 Skill）
agent.md 應包含的內容
你是誰（身份、頻道定位、受眾畫像）
輸出語言與格式（如：繁體中文、務實客觀、不拐彎抹角）
工作原則（如：執行前先列計劃、完成後報告生成文件清單）
根目錄命名規範（agent.md / memory / content / workflow / sandbox）
Codex vs Claude 桌面端主要差異
| 項目 | Codex | Claude 桌面端 |
|------|-------|-------------|
| Plugin 外掛整合 | 有（視覺化安裝） | 無（需用 CLI 方式） |
| Skill 視覺化管理 | 有介面展示 | 有但介面較簡 |
| 多工並行對話框 | 有（Fork Chat） | 無 |
| 自動化排程 | 有（類似 Routine/Schedule） | 部分支援 |
--

結論

“Codex 的核心價值不在於它有多聰明，而在於透過 agent.md + Skill + Plugin 的組合，它能以標準化、可並行、無需人工監督的方式替你「交付結果」，而不只是「給出建議」。”

完整解析

詳細

現有的 AI 工具如 ChatGPT 或 Gemini 的使用模式，本質上是「問答循環」——使用者問，AI 給建議，但實際執行還是靠人。OpenAI 推出的 Codex 桌面 App 試圖打破這個模式：它安裝在使用者的本機電腦上，能直接讀寫本地文件、連接外部服務（Gmail、Google Calendar、Canva、Figma 等），並且可以在背景同時執行多個複雜任務，使用者去做自己的事，回來任務就已完成。這對內容創作者與小型企業主而言，代表著一個根本性的工作模式轉變。

安裝與設定方面，Codex 提供 ChatGPT 帳號直接登入，也支援 OpenAI API Key 或第三方中轉 API，並可調用 GPT-5.5 以外的第三方模型。介面分為左側功能選單、中間對話區、右側預覽區三大區塊，對話框下方可設定模型型號、處理速度（標準 / 快速 / 1.5 倍速），以及 Effort 智慧等級（建議選「高」或「超高」）。真正讓 Codex 發揮最大效用的關鍵有兩件事：一是建立 Project 資料夾，二是在根目錄放置 agent.md 文件。agent.md 是 AI 員工的入職手冊，定義使用者身份、受眾畫像、輸出語言格式與工作原則，Codex 每次開始任務前都會先讀取這份文件。建議透過對話讓 Codex 自動根據你既有的提示詞與文件生成這份文件，並設定每日早上定時自動優化更新。

在功能層次上，Codex 提供兩種核心擴充機制。Plugin（外掛程式）負責接入外部工具：Computer Use 可操控整台電腦、Browser Use 可控制瀏覽器、Gmail Plugin 可讀取與回覆郵件、Canva Plugin 可直接把生成的圖片導入 Canva 後台編輯，吉夢（Jimeng）與 LibTV 的 CLI 工具則可讓 Codex 直接生成影片片段。Skill（技能）則是把重複性 SOP 封裝成 Markdown 文件，例如「IG 文案 Skill：繁體中文、口語化、每則 150 字、結尾有 CTA」，往後只需輸入 `/ig文案` 指令加上主題，Codex 便會按標準格式產出，品質完全一致。兩者的差異在於：Plugin 解決「用什麼工具」的問題，Skill 解決「怎麼做事」的問題。

實際示範中，講者展示了多條並行工作流：輸入一張穿搭分鏡圖 + 一句提示詞，Codex 調用 LibTV CLI 的 Seedance 2.0 模型生成完整 Vlog 影片片段並拼接成片；輸入一張音樂播放器設計草圖，透過 Build iOS App Plugin 完整開發出可在 Xcode 模擬器上運行的 iOS App，且多巴胺配色風格隨歌曲切換動態更換；調用 info summary Skill 生成含 13 個區塊的視覺化 HTML 報告，選擇風格後即時渲染。這些任務若逐一手動完成各需 2-3 小時，而 Codex 透過 Fork Chat（分叉功能）開啟多個並行對話框，可將所有任務壓縮至 20-30 分鐘內同步完成。

---

關鍵時刻

Pipeline v2

帶時間戳的重點，會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

Codex保姆級完整教學：從入門到進階，自動生成內容、網頁、影片和App，快速學會指揮你的超級AI Agent #chatgpt #codex

三句話摘要

重點整理

實用技巧與重點

結論

完整解析

關鍵時刻

事實查核

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手？

我贏得 NVIDIA GTC Taipei 2026 的金票啦！這 4 天展期會有什麼不一樣的體驗呢？ | Computex 2026

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備