KeyFrame

AI Agent基本功EP01:用Agent來學習Agent_一個 GitHub repo,複製我的整套 AI 工作流到你的 Agent

三師爸Sense Bar·6月15日週一·48 min中文

三句話摘要

AI Agent 基本功第一集:從生成式 AI 轉型到本地代理 AI 的核心概念與入門工具選擇。 AI Agent 的本質是把雲端 AI 搬進本機、讓它直接操控電腦,一旦學會「專案資料夾 + 雙層 .md 記憶檔 + 問 Agent 代替看教學」這個工作邏輯,效率就能從根本上突破生成式 AI 的上限。 生成式 AI vs. AI Agent 的本質差異

重點整理

重點
  • 1

    生成式 AI vs. AI Agent 的本質差異

  • 2

    雲端 AI 只能在瀏覽器對話框內工作,使用者必須手動在各工具間複製貼上、切換視窗;AI Agent 直接在本機執行,可讀寫檔案、操控程式與瀏覽器,把人類從勞務中解放出來。

  • 3

    Agent 的記憶架構是雙層 .md 檔

  • 4

    Agent 只記得兩個地方的內容:全域 agents.md(所有專案通用的設定與身份資訊)和專案目錄內的 agents.md(該專案的工作藍圖)。換電腦或換專案目錄,其餘對話內容一概不保留,這是與雲端 AI 最大的操作差異。

  • 5

    「用 Agent 學 Agent」的方法論

  • 6

    講者將自己頻道所有影片字幕(繁體中文,專為演算法與 AI 上傳)批次下載到本機專案資料夾,讓 Agent 以此為知識庫,使用者直接問問題就能得到「該看哪集影片、具體怎麼做」的精確指引,省去逐集觀看的時間。

  • 7

    工作流程可透過 GitHub repo 共享給任何人的 Agent

  • 8

    將工作流程寫成 README/MD 檔放到公開 GitHub repo,任何人的 Agent 讀取該網址後即可完整複製整套流程。現代 repo 的讀者已不是人類,而是 AI Agent。

實用技巧與重點

乾貨
  • 工具與平台
  • Claude Code:付費,額度消耗快,不推薦一般教育工作者訂閱
  • Codex(OpenAI):月費 $20 美元,最推薦,速度略慢但聰明、功能全面、可畫圖
  • AntiGravity(Google Gemini 桌面代理版):需 Google Pro 訂閱 $20 美元/月
  • OpenCode:開源免費,設定較繁瑣,需自行申請 API key
  • NotebookLM:可貼入 YouTube 網址抓取字幕作為知識庫(每次最多 10 條)
  • 免費方案推薦模型
  • OpenCode Zen 方案 → DeepSeek V4 Flash Free(推薦首選)
  • NVIDIA 免費方案 → DeepSeek V4 Flash(需排隊,速度較慢)
  • Python 工具(影片中刻意未唸出名稱以避免 YouTube 版權警告)
  • 可批次抓取 YouTube 字幕,支援多種輸出格式,安裝後直接在 Agent 指令中呼叫
  • Agent 記憶檔命名規則
  • Codex 預設:`agent.md`
  • Claude Code 預設:`claude.md`
  • AntiGravity 預設:`antigravity.md`(各系統略有不同)
  • 操作流程(AntiGravity 示範)
  • 新增本機資料夾作為專案目錄
  • 在 Agent 介面選 New Project,指向該資料夾
  • 開啟 Turbo Mode(自動核准所有操作)
  • 讓 Agent 安裝 Python 字幕抓取工具
  • 指定 YouTube 頻道,批次下載所有字幕檔至專案資料夾
  • 在對話中直接提問,Agent 從字幕檔找答案並回傳影片名稱與網址
  • 輸出工作流程說明至公開 GitHub repo,供他人 Agent 複製
  • 效益數字
  • 宣稱效率提升:5–10 倍(相較使用生成式 AI)
  • Codex 月費:$20 美元(約新台幣 600 元)
  • Claude Code 額度:拍攝當天已用盡,距重置仍剩 17 分鐘

結論

結論

AI Agent 的本質是把雲端 AI 搬進本機、讓它直接操控電腦,一旦學會「專案資料夾 + 雙層 .md 記憶檔 + 問 Agent 代替看教學」這個工作邏輯,效率就能從根本上突破生成式 AI 的上限。

完整解析

詳細

這支影片是三師爸「AI Agent 基本功」系列的第一集,專為從未接觸過本地代理 AI 的教育工作者設計,核心問題是:生成式 AI 和 AI Agent 到底差在哪裡,以及怎麼用最低成本開始入門。

講者首先釐清兩者的根本差異。過去大家熟悉的 ChatGPT 對話、Gemini、NotebookLM 都屬於生成式 AI,所有對話資料存在雲端伺服器,換電腦登入帳號即可取回,使用上毫無門檻。然而正因為它跑在雲端,AI 無法觸及使用者的本機檔案,使用者必須在不同工具之間手動複製貼上、切換視窗,工作流程被切割成一段一段。AI Agent 則是把 AI「請進」本機電腦,透過一個像作業系統的桌面應用程式作為執行環境(Codex Desktop、AntiGravity 桌面版、OpenCode 等),讓 AI 能夠讀寫任意檔案、操控瀏覽器、執行程式,完全取代人類在電腦上所有的勞務操作。講者強調,這種效率差距是 5 至 10 倍,一旦使用過 Agent,便幾乎不會再回頭開 ChatGPT 或 Gemini 的網頁版。

工具選擇上,講者根據訂閱費用與使用體驗給出明確建議。Claude Code 功能強大但額度燒得極快,拍攝當天已耗盡額度,不推薦資源有限的教育工作者訂閱。Codex(OpenAI)月費 20 美元、功能全面且支援繪圖,是他最推薦付費的選擇。Google 的 AntiGravity 桌面版同樣月費 20 美元,適合已有 Google Pro 訂閱的用戶。完全不想花錢的話,可以安裝開源的 OpenCode,搭配免費的 DeepSeek V4 Flash Free 模型使用,雖然設定步驟較繁瑣,但足以體驗 Agent 的基本能力。

在觀念建立後,講者現場示範了這集的核心主題——「用 Agent 學 Agent」。他的 YouTube 頻道每部影片都有繁體中文字幕,這些字幕並非只為觀眾而上,而是同時為 YouTube 演算法和觀眾自己的 AI Agent 準備的機器可讀語料。示範中,他在 AntiGravity 裡建立一個新的本機專案資料夾,讓 Agent 安裝一套 Python 字幕抓取工具(因版權疑慮刻意未口頭點名),批次下載頻道內所有影片的字幕檔存到本機。接著直接在對話框提問:「我要從零開始學 AI Agent 處理教學檔案,應該看哪幾集影片?」Agent 立刻從字幕檔中找出相關內容,回傳具體做法、影片名稱與直達網址。這套流程讓使用者不必再逐集瀏覽播放清單,只需問 Agent,它就充當一個懂得所有頻道內容的私人助理。

最後講者展示了 Agent 時代的知識共享方式。他當場讓 Agent 把剛才的整套工作流程寫成一份 Markdown 說明文件,推送到公開 GitHub repo,並將網址貼到直播聊天室。任何人只要把這個網址丟給自己的 Agent,Agent 讀取後就能完整複製這套工作流程,無需再看影片或閱讀教學。這個示範說明了現代 GitHub repo 的真正讀者已經不是人類,而是 AI Agent 本身。

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手?
16 min
AI 技術中文6月20日

Claude Cowork vs Codex: 誰才是更好的AI工作助手?

李厂长来了

  • 介面設計哲學不同:Codework 以標籤頁區分聊天、文書與程式碼三種模式,任務彼此隔離不混淆;Codex 則將所有功能整合在單一介面,減少切換成本,但頁面相對雜亂。
  • 第三方整合能力差距明顯:Codework 提供大量連接器並支援 Zapier 擴展,且可針對每個連接器精細設定讀寫權限(如 Gmail 只讀免確認、寫信需批准);Codex 的插件數量較少且缺乏同等級的權限控制機制。
  • 定時任務管理方式影響長期使用體驗:Codework 將同一自動化任務的歷史記錄歸類在同一條目下,便於追蹤;Codex 每次執行都獨立列出,隨任務增多左側欄會越來越臃腫,不利於長期管理。
我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026
編輯精選
28 min
AI 技術中文6月20日

我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026

EngineerGary

  • Tokenomics 重新定義 AI 工廠價值:黃仁勛將所有輸出重新框架為 Token = Revenue,傳統工廠生產實體商品,AI 工廠改為生產 Token;對製造端而言,目標是以最低成本產生最多 Token,實現每投入 1 元帶回 3–5 元回報的商業邏輯。
  • 開源策略是市場放大器而非讓利:NVIDIA 釋出 Cosmos 3、Apomile 3 等開源模型,以及通用人型機器人,目的是降低新創進入自動駕駛、World Model、Physical AI 的門檻,擴大整體生態系規模,最終帶動更多算力與服務需求(「The more you buy, the more you earn」)。
  • Deal to Delivery Agent 解決中小企業流程瓶頸:Gary 團隊識別出企業收到客戶需求後,需跨工具手動完成報價、開票、GitHub issue、通知等重複性操作是最大效率殺手;Agent 自動拆解商機、建立 ERP 記錄並推送 Telegram 通知,人類只需在 Draft 狀態下做最終 Review 確認。
黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備
編輯精選
30 min
AI 技術中文6月20日

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備

Coco哥

  • QNX 擁有機器人 OS 三大不可替代技術門檻
  • Windows 響應延遲 200 毫秒,Linux 一旦核心崩潰全部失效,而 QNX 具備毫秒級即時決策、ISO 26262 ASIL-D 與 IEC 61508 SIL-3 最高安全認證,以及微型內核獨立架構(單一模組崩潰不影響其餘系統),三項條件同時達標,現階段競爭對手均未能複製。
  • 40 年護城河非短期可追趕