KeyFrame

Codex 新手教學,非技術人員也能上手的 AI Agent 新手指南

Gary Chen·6月14日週日·17 min中文

三句話摘要

從零上手 Codex:一個能直接操作你電腦檔案的 AI Agent,與 ChatGPT 的本質差異及四大使用基本功。 --- Codex 的價值在於它是真正在你電腦裡幹活的 Agent,而不是聊天機器人;掌握「專案、權限、上下文、AGENTS.md」四個基本功,就能把它從一個聰明的工具升級成越來越懂你的工作夥伴。 Codex 與 ChatGPT 的本質差異是執行層級不同。 ChatGPT 住在瀏覽器,你上傳它回答,動手的還是你;Codex 住在電腦裡,直接在授權範圍內讀檔、改檔、產生成品,是真正的執行者而非顧問。

重點整理

重點
  • 1

    Codex 與 ChatGPT 的本質差異是執行層級不同。 ChatGPT 住在瀏覽器,你上傳它回答,動手的還是你;Codex 住在電腦裡,直接在授權範圍內讀檔、改檔、產生成品,是真正的執行者而非顧問。

  • 2

    專案資料夾是 Codex 的工作邊界,整理資料夾本質上就是 Context Engineering。 把相關檔案歸入同一資料夾並取清楚的名稱,能讓 Codex 專注正確範圍、不亂翻整台電腦,同時避免白白消耗 token。

  • 3

    AGENTS.md 只放最低限度的規則,冗長 SOP 做成 Skill 另存。 每次開新 session Codex 都會先讀完這份文件,規則越肥佔用的思考空間越多,反而拉低回答品質;Skill 則是用時才叫出,不佔常駐空間。

  • 4

    Codex 除了是助理也是家教,使用者應以「帶新同事」的心態管理它。 給背景、確認計畫、驗收成果、錯了要說明哪裡錯、為什麼錯,這樣才能讓 Codex 越來越貼近你的工作方式,形成可持續校正的工作系統。

  • 5

    --

實用技巧與重點

乾貨
  • 工具 / 平台 / 模型
  • Codex(OpenAI AI Agent 桌面版)、ChatGPT、Claude Code、Claude Cowork
  • 圖像生成模型:image 2(Codex 內建)
  • 外掛程式:Gmail、Google Drive
  • 權限三模式
  • 要求核准模式(預設):只能讀,改檔需逐一授權
  • 待我核准模式:工作資料夾內自由讀寫,出資料夾或連網才問
  • Full Access / YOLO 模式:完全放行,含網路與整台電腦
  • 介面功能
  • 三欄式:左(對話/專案/外掛)、中(輸入)、右(預覽/結果)
  • `@` 附加特定檔案、`/` 查看狀態或指定 Skill
  • Fork(分叉):從同一節點產生平行 session,A/B 測試兩條路徑
  • 視覺化註解:在網頁預覽直接點元素下指令,不需會寫 code
  • `/compact`:手動壓縮上下文,建議上下文達 80% 時執行
  • AGENTS.md 範例規則
  • 請用繁體中文輸出
  • 不要刪除原始檔
  • 修改文件前先說明要改哪裡
  • 所有報名名單輸出成 Excel
  • 做完附上處理摘要
  • 講座籌備案例步驟
  • 掃描資料夾 → 重新命名檔案(如 `final最後版` → `202606_講座活動說明`)
  • 整理報名名單 Excel,保留姓名/部門/信箱/出席/飲食欄位,產出處理日誌
  • 串接 Gmail,針對每人寫客製確認信
  • 用 Planning Mode 先列網站架構計畫,確認規格後才動手
  • 用 image 2 生成活動主視覺、簡報封面、講者卡片
  • 語音輸入使用比例:講者本人約 80%
  • --

結論

結論

Codex 的價值在於它是真正在你電腦裡幹活的 Agent,而不是聊天機器人;掌握「專案、權限、上下文、AGENTS.md」四個基本功,就能把它從一個聰明的工具升級成越來越懂你的工作夥伴。

完整解析

詳細

現在的 AI 工具可以粗分成兩類:住在瀏覽器的聊天機器人(如 ChatGPT、Claude 網頁版),以及住在電腦裡的 Agent(如 Codex、Claude Code)。前者的工作流程是「你上傳 → 它回答 → 你下載整理」,人還是主要的執行者;後者則是直接鑽進你的工作環境,在授權範圍內自己讀檔、改檔、產出成品。把 Codex 當 ChatGPT 用,就像買了特斯拉只拿來聽廣播——功能根本沒發揮到。

正因為 Codex 能碰你的電腦,新手必須先掌握四個基本功才能安全駕馭它。第一是專案:把相關檔案集中在一個資料夾,Codex 就只在這個邊界裡運作,不會大海撈針地翻整台電腦;這件事本質上就是 Context Engineering,資料夾整理乾淨,AI 協作效率才會高。第二是權限:三種模式從保守到全開,建議新手從「待我核准」模式起手,被問幾次摸清邏輯後再逐步放手,進階用戶可開 Full Access 但要在 AGENTS.md 裡鎖死不可逆操作(如「不得刪除原始檔」)以降低風險。第三是上下文管理:上下文太長會壓縮 Codex 的思考空間,建議每完成一個階段就用 `/compact` 手動壓縮,上下文指示器到 80% 就處理,不要等滿了被迫自動壓縮而漏掉重要資訊。第四是 AGENTS.md:這份放在專案資料夾的規則書是每次 session 的最高指導原則,只寫最低限度的必要規則(輸出語言、禁止動作、格式要求),冗長的 SOP 另存為 Skill,需要時再叫出,避免常駐佔空間拉低品質。

AGENTS.md 與 Memory 的區別值得特別說明:AGENTS.md 是你親手寫的專案員工守則,跟著資料夾走、可精確控制;Memory 是 Codex 自動累積的個人觀察筆記,會越來越懂你,但可能過度解讀(例如你只是短暫試了某個框架,它卻以為是長期習慣)。因此 Memory 要定期清理,直接問 Codex「你現在記了我哪些東西」再告訴它哪些可刪。簡單說:個人長期偏好給 Memory,專案規則與地雷寫進 AGENTS.md。

實際應用上,以籌辦一場線下講座為例,Codex 可以依序完成:掃描並重命名資料夾裡的混亂檔案、整理報名名單成格式乾淨的 Excel 並產出處理日誌(含缺漏欄位清單)、串接 Gmail 寫客製確認信、用 Planning Mode 先規劃網站架構再動手做活動頁、用 image 2 生成視覺素材。除了執行,Codex 也能扮演「家教」角色——不懂某個工具,可以叫它邊裝邊解釋;拿到別人的 Skill 看不懂,丟給它問怎麼用、怎麼改成適合自己的版本。最終目標不是省幾分鐘,而是建立一套可持續訓練、校正、沉澱的個人工作系統。

---

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手?
16 min
AI 技術中文6月20日

Claude Cowork vs Codex: 誰才是更好的AI工作助手?

李厂长来了

  • 介面設計哲學不同:Codework 以標籤頁區分聊天、文書與程式碼三種模式,任務彼此隔離不混淆;Codex 則將所有功能整合在單一介面,減少切換成本,但頁面相對雜亂。
  • 第三方整合能力差距明顯:Codework 提供大量連接器並支援 Zapier 擴展,且可針對每個連接器精細設定讀寫權限(如 Gmail 只讀免確認、寫信需批准);Codex 的插件數量較少且缺乏同等級的權限控制機制。
  • 定時任務管理方式影響長期使用體驗:Codework 將同一自動化任務的歷史記錄歸類在同一條目下,便於追蹤;Codex 每次執行都獨立列出,隨任務增多左側欄會越來越臃腫,不利於長期管理。
我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026
編輯精選
28 min
AI 技術中文6月20日

我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026

EngineerGary

  • Tokenomics 重新定義 AI 工廠價值:黃仁勛將所有輸出重新框架為 Token = Revenue,傳統工廠生產實體商品,AI 工廠改為生產 Token;對製造端而言,目標是以最低成本產生最多 Token,實現每投入 1 元帶回 3–5 元回報的商業邏輯。
  • 開源策略是市場放大器而非讓利:NVIDIA 釋出 Cosmos 3、Apomile 3 等開源模型,以及通用人型機器人,目的是降低新創進入自動駕駛、World Model、Physical AI 的門檻,擴大整體生態系規模,最終帶動更多算力與服務需求(「The more you buy, the more you earn」)。
  • Deal to Delivery Agent 解決中小企業流程瓶頸:Gary 團隊識別出企業收到客戶需求後,需跨工具手動完成報價、開票、GitHub issue、通知等重複性操作是最大效率殺手;Agent 自動拆解商機、建立 ERP 記錄並推送 Telegram 通知,人類只需在 Draft 狀態下做最終 Review 確認。
黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備
編輯精選
30 min
AI 技術中文6月20日

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備

Coco哥

  • QNX 擁有機器人 OS 三大不可替代技術門檻
  • Windows 響應延遲 200 毫秒,Linux 一旦核心崩潰全部失效,而 QNX 具備毫秒級即時決策、ISO 26262 ASIL-D 與 IEC 61508 SIL-3 最高安全認證,以及微型內核獨立架構(單一模組崩潰不影響其餘系統),三項條件同時達標,現階段競爭對手均未能複製。
  • 40 年護城河非短期可追趕