KeyFrame

How to build proactive agents & self-improving company (Fully explained)

AI Jason·6月2日週二·11 min中文

三句話摘要

如何為企業建立 AI 自我迭代閉環系統,讓代理在無人干預下持續執行、學習並優化運營。 AI 原生閉環的競爭護城河不在於工具數量,而在於記憶層、技能與 Cron Job 三者協同讓代理能夠自我學習——這才是讓公司「在你睡覺時變得更好」的真正機制。 AI 增強工作流與 AI 原生閉環的本質差異:前者讓 AI 完成單次任務後即停止,缺乏反饋;後者要求代理捕捉每次執行的結果,從中提取學習並自主規劃下一步改進,形成真正的自我迭代循環。

重點整理

重點
  • 1

    AI 增強工作流與 AI 原生閉環的本質差異:前者讓 AI 完成單次任務後即停止,缺乏反饋;後者要求代理捕捉每次執行的結果,從中提取學習並自主規劃下一步改進,形成真正的自我迭代循環。

  • 2

    閉環系統的三大核心組件缺一不可:記憶層分為事實性記憶(歷史行為 log)與程序性學習(可轉化為技能的經驗),技能庫讓代理有能力端對端完成特定工作,Cron Job 則定期觸發執行、提取學習並更新策略。

  • 3

    廣告自主實驗驗證了閉環的真實效力:代理第一週測試 10 種格式後自行發現「醜廣告」效果更好,第二週依此學習調整策略,這種跨週期自主決策正是開環工作流做不到的。

  • 4

    工具設計必須針對代理場景優化:市面上大多數 API 和 MCP 並非為代理設計,存在 token 效率差、互動模式不相容、錯誤訊息不足以自愈等問題;Printing Press 等工具嘗試以 10 條 agent-native CLI 原則來解決這個根本問題。

實用技巧與重點

乾貨
  • Y Combinator 當前批次:員工人均營收較 18 個月前提升 5 倍
  • 某批次公司代理自主編寫 45 個工具
  • Porsche 融資 3,000 萬美元以 AI 方式建立並運營整間公司
  • SEO 案例(Enkit, AI Build Club):流量 1-2 個月內提升 3 倍
  • 廣告案例(Georgio):預算 $1,500,一個月內獲得 243 個潛在客戶
  • 廣告實驗第一週:測試 10 種廣告素材格式(白板、筆記、紙板、推文截圖等),代理自行判定「醜廣告」效果最佳
  • 工具名稱:HubSpot 免費 AEO CreatorJbring(Gary Tan)、Looping(開源 agent school)、Printing Press(agent-native CLI 建構工具)、Hermes OpenCrawl
  • 數據來源平台:Google Console、Ahrefs、Google Analytics
  • AI 回答引擎覆蓋:ChatGPT、Perplexity、Gemini
  • 記憶層技術棧:向量資料庫(vector DB)+ CLI + MCP 工具
  • YC 閉環五大核心層:數據攝入層、策略層(Policy/SOP)、系統存取層、品質閘門(人類或 AI 評估者)、學習反饋機制

結論

結論

AI 原生閉環的競爭護城河不在於工具數量,而在於記憶層、技能與 Cron Job 三者協同讓代理能夠自我學習——這才是讓公司「在你睡覺時變得更好」的真正機制。

完整解析

詳細

Y Combinator 最近舉辦了一場「自我改進公司」專場,披露了當前批次的驚人數據:員工人均營收是 18 個月前的 5 倍,代理已能自主編寫內部工具,Porsche 甚至融資 3,000 萬美元以此模式從零建立整間公司。這些案例共同指向一個結論:AI 原生的企業運作方式正在成為真實可行的路徑,而不只是概念。

講者指出,目前多數企業仍停留在「AI 增強」階段,即讓 AI 完成某個任務後流程便結束,人仍是優先排序與觸發決策的主體。真正的突破在於建立閉環(closed loop)——代理不只執行任務,還要持續捕捉結果、提取學習、更新策略,讓下一次執行比上一次更好。YC 的 Diana 用控制系統框架說明這件事:開環系統沒有狀態反饋,閉環系統則將狀態、決策與結果持續輸入智能層,並細分為五個核心元素:數據攝入、策略/SOP 層、系統存取層、品質閘門,以及將學習帶回系統的反饋機制。

具體落地時,講者以 SEO 為切入點說明建構步驟。記憶層分為兩部分:時間軸 log(記錄代理每次做了什麼)和策略文件(從 log 中提煉的最新方向)。技能庫則包含 SEO 審計、內容起草、發布、從 Google Analytics 和 Ahrefs 讀取數據等可重複呼叫的工具。Cron Job 定期觸發整個循環並要求代理提取學習、更新策略。AI Build Club 的 Enkit 用此設置在 1-2 個月內讓流量成長 3 倍。廣告案例更具說服力:Georgio 讓代理自主跑了一個月廣告,第一週測試 10 種素材格式後,代理自行判定「醜廣告」效果最佳;第二週即依此決策,鎖定白板風格加免費技能包文案,最終以 1,500 美元獲得 243 個潛在客戶——這種跨週期自主學習與決策,正是傳統工作流無法複製的核心價值。

在工具層面,講者介紹了幾個關鍵資源。Gary Tan 的開源插件 Jbring 以實體化結構管理個人助理場景的記憶;講者團隊自行開發的 Looping 則針對長週期任務和自我學習行為優化,可對話式引導代理逐步建立記憶結構、Cron Job 與技能提案。Printing Press 則解決了一個根本性問題:現有 API 和 MCP 並非為代理設計,存在 token 浪費、互動模式不相容、錯誤訊息不足以自愈等問題,該工具讓代理依據 10 條 agent-native CLI 設計原則自主構建高效的數據存取工具。此外,HubSpot 免費 AEO Creator 補足了傳統 SEO 工具的盲點,分析品牌在 ChatGPT、Perplexity、Gemini 等 AI 回答引擎中的可見度,可直接將審計報告餵給代理形成內容策略。

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手?
16 min
AI 技術中文6月20日

Claude Cowork vs Codex: 誰才是更好的AI工作助手?

李厂长来了

  • 介面設計哲學不同:Codework 以標籤頁區分聊天、文書與程式碼三種模式,任務彼此隔離不混淆;Codex 則將所有功能整合在單一介面,減少切換成本,但頁面相對雜亂。
  • 第三方整合能力差距明顯:Codework 提供大量連接器並支援 Zapier 擴展,且可針對每個連接器精細設定讀寫權限(如 Gmail 只讀免確認、寫信需批准);Codex 的插件數量較少且缺乏同等級的權限控制機制。
  • 定時任務管理方式影響長期使用體驗:Codework 將同一自動化任務的歷史記錄歸類在同一條目下,便於追蹤;Codex 每次執行都獨立列出,隨任務增多左側欄會越來越臃腫,不利於長期管理。
我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026
編輯精選
28 min
AI 技術中文6月20日

我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026

EngineerGary

  • Tokenomics 重新定義 AI 工廠價值:黃仁勛將所有輸出重新框架為 Token = Revenue,傳統工廠生產實體商品,AI 工廠改為生產 Token;對製造端而言,目標是以最低成本產生最多 Token,實現每投入 1 元帶回 3–5 元回報的商業邏輯。
  • 開源策略是市場放大器而非讓利:NVIDIA 釋出 Cosmos 3、Apomile 3 等開源模型,以及通用人型機器人,目的是降低新創進入自動駕駛、World Model、Physical AI 的門檻,擴大整體生態系規模,最終帶動更多算力與服務需求(「The more you buy, the more you earn」)。
  • Deal to Delivery Agent 解決中小企業流程瓶頸:Gary 團隊識別出企業收到客戶需求後,需跨工具手動完成報價、開票、GitHub issue、通知等重複性操作是最大效率殺手;Agent 自動拆解商機、建立 ERP 記錄並推送 Telegram 通知,人類只需在 Draft 狀態下做最終 Review 確認。
黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備
編輯精選
30 min
AI 技術中文6月20日

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備

Coco哥

  • QNX 擁有機器人 OS 三大不可替代技術門檻
  • Windows 響應延遲 200 毫秒,Linux 一旦核心崩潰全部失效,而 QNX 具備毫秒級即時決策、ISO 26262 ASIL-D 與 IEC 61508 SIL-3 最高安全認證,以及微型內核獨立架構(單一模組崩潰不影響其餘系統),三項條件同時達標,現階段競爭對手均未能複製。
  • 40 年護城河非短期可追趕