KeyFrame

Gemini 已經過時?2026 必須了解 AI Agent|Manus / Claude Cowork 教學|中小企必學「虛擬員工」

Hello AI | 快速應用AI·4月16日週四·24 min中文

三句話摘要

AI Agent 與傳統 AI 助手(如 Gemini)的本質差異,並以 Cowork 與 Manus 實機示範 Agent 的自主執行、技能封裝與跨平台整合能力。 --- AI Agent 的核心價值不在於比 Gemini 更聰明,而在於能自主規劃、執行、串接外部系統,真正成為替你「做完事」的 AI 員工,而非只是給建議的顧問。 AI Agent 的核心價值是執行,而非回答:傳統 AI 助手如 Gemini 以問答為主,給出大量文字後仍需人工轉換為 Excel 或 PowerPoint;AI Agent 則自行規劃步驟、調用工具、寫入真實檔案,直接替代人工完成任務,且失敗時會自動嘗試其他方法。

重點整理

重點
  • 1

    AI Agent 的核心價值是執行,而非回答:傳統 AI 助手如 Gemini 以問答為主,給出大量文字後仍需人工轉換為 Excel 或 PowerPoint;AI Agent 則自行規劃步驟、調用工具、寫入真實檔案,直接替代人工完成任務,且失敗時會自動嘗試其他方法。

  • 2

    Skill 是可移植的多步驟工作流程套件:Skill 不是單一 prompt,而是包含多個執行階段與可執行程式碼的工作封裝,可在 Manus、Cowork 等不同 Agent 之間以 ZIP 格式移植安裝,實現跨平台能力共用。

  • 3

    Manus 的知識庫機制比 Gemini 的 Gem 更自然:Manus 在日常工作中自動偵測用戶的重複偏好並儲存為「知識」,同時記錄「使用時機」,下次執行類似任務時自動調用,無需用戶主動設定專屬助手。Gemini 的 Gem 則需要用戶手動建立並輸入 prompt。

  • 4

    Connector 讓 AI Agent 成為跨平台整合樞紐:透過 Connector 串接外部服務,AI Agent 可自動完成「客戶透過 PayPal 付款 → 建立 Excel 存入 Jobbox → 調用 Gmail 寄出感謝信」等跨系統工作流,真正實現辦公室端對端自動化。

  • 5

    --

實用技巧與重點

乾貨
  • 工具與平台
  • Cowork(Claude AI Agent,安裝於本機的桌面 App,非瀏覽器)
  • Manus AI(辦公室型 AI Agent,具備知識庫與 Skill 系統)
  • Minimax(第三方 TTS 服務,提供廣東話專業女聲)
  • 外部 Connector 平台:Jobbox、PayPal、Gmail、Minimax(數量「數之不盡」)
  • 下集預告工具:Anti-Gravity(疑為 Anthropic 相關編程工具)、Google AI Studio、n8n
  • 具體數據與案例
  • 名片 Demo:9 張名片圖片 → Cowork 自動呼叫 Python script 生成 Excel,全程無需人工介入
  • 電子書案例:200 頁 PDF(Gemini 應用天書),Cowork 生成耗時 20 分鐘,事後人工整理約 1.5 天
  • Manus 自動記憶的 Facebook 貼文偏好包含:強調反差、控制字數、金句獨立成行、短句適合手機閱讀
  • Skill 技術細節
  • 格式為 `skill.md`,內含多階段 prompt(示範中為 5 個階段)及可執行程式碼
  • 打包格式為 ZIP,可從 Manus 下載後直接上傳至 Cowork 安裝
  • Minimax 廣東話 TTS Skill 跨 Agent 移植測試:成功(但講者提醒不保證通用,常需 fine-tune 或修改程式碼)
  • AI Agent 錯誤自我修復:任務失敗時自動改用其他方法,無需人工介入
  • --

結論

結論

AI Agent 的核心價值不在於比 Gemini 更聰明,而在於能自主規劃、執行、串接外部系統,真正成為替你「做完事」的 AI 員工,而非只是給建議的顧問。

完整解析

詳細

2026 年第一季,AI 工具的生態已從「通用助手」走向「分工明確的專業工具」。影片作者以此為背景,深入比較 AI Agent 與傳統 AI 助手的根本差異,並以 Cowork 和 Manus 兩款工具進行實機示範。

傳統 AI 助手(以 Gemini 為例)的使用模式是問答式:用戶提問,AI 給出文字,用戶再自行將內容轉換為 Excel、PowerPoint 或其他格式。當需要連接外部系統時,Gemini 的限制更加明顯——例如自動查詢網店收款狀態,在現有架構下並不容易實現。這種模式讓 Gemini 像是「一個聰明但被困在孤島上的人」,只能靠問答提供服務。AI Agent 的定位則截然不同:它不以回答問題為核心,而是聚焦於任務執行。

第一個示範使用 Cowork(一款安裝於本機的桌面應用,非瀏覽器工具)。作者將一批名片圖片的資料夾授權給 Cowork,下達一句指令:「請將資料夾內的名片資訊抽取並寫入 Excel」。Cowork 隨即自行規劃步驟——先讀取圖片、抽取文字資訊,再呼叫 Excel skill,並在過程中自動撰寫 Python script 建立檔案。整個過程中,作者只需在初始授權時給予確認,其餘全部由 Agent 自主完成,最終輸出一份格式完整的 Excel 表,涵蓋所有 9 張名片的資訊。Cowork 的另一個關鍵特性是錯誤自我修復:若某個方法執行失敗,它會自動改用其他方式重試,全程無需人工介入。

第二個示範切換至 Manus,難度更高。作者僅貼入一篇英文文章的 URL,加上一句「請改寫成 Facebook 貼文」,沒有提供任何格式要求。Manus 首先控制本機瀏覽器開啟網頁讀取文章,接著自動上網搜尋補充素材,然後提出三個改寫方向讓用戶選擇,確認後才開始撰寫。完成文字後,Manus 進一步提供配圖方案:選用官方形象圖或以 Nanobala 生成 AI 圖片,並自動撰寫程式將文字疊加至圖片上,產出可直接發佈的 Facebook 貼文。這一切的背後,是 Manus 的「知識庫」機制在運作——它在過往多次協助撰寫 Facebook 貼文的過程中,自動記憶了作者的偏好(如短句、金句獨立成行、強調反差等),並在這次任務中自動調用,無需重新說明。這與 Gemini 需要用戶手動建立 Gem 的方式形成鮮明對比。

影片後半段深入講解 Skill 與 Connector 兩個核心機制。Skill 是多步驟工作流程的封裝,內含各階段的 prompt 與可執行程式碼,以 `.md` 格式儲存,可打包為 ZIP 在不同 Agent 間移植。作者以 Minimax 廣東話 TTS Skill 為例,展示從 Manus 建立 Skill、下載 ZIP、上傳至 Cowork,並成功執行語音生成的完整流程——雖然移植成功率並非百分百,實際應用中常需調整。Connector 則讓 Agent 能串接 Jobbox、PayPal、Gmail 等外部平台,從根本上擴展了 Agent 的「手腳」,使其能跨系統完成完整的業務流程。影片最後,作者分享個人偏好:Cowork 操作流暢適合一般任務(曾以 20 分鐘生成 200 頁 PDF 電子書),Manus 則更擅長辦公室類型的精細工作。

---

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手?
16 min
AI 技術中文6月20日

Claude Cowork vs Codex: 誰才是更好的AI工作助手?

李厂长来了

  • 介面設計哲學不同:Codework 以標籤頁區分聊天、文書與程式碼三種模式,任務彼此隔離不混淆;Codex 則將所有功能整合在單一介面,減少切換成本,但頁面相對雜亂。
  • 第三方整合能力差距明顯:Codework 提供大量連接器並支援 Zapier 擴展,且可針對每個連接器精細設定讀寫權限(如 Gmail 只讀免確認、寫信需批准);Codex 的插件數量較少且缺乏同等級的權限控制機制。
  • 定時任務管理方式影響長期使用體驗:Codework 將同一自動化任務的歷史記錄歸類在同一條目下,便於追蹤;Codex 每次執行都獨立列出,隨任務增多左側欄會越來越臃腫,不利於長期管理。
我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026
編輯精選
28 min
AI 技術中文6月20日

我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026

EngineerGary

  • Tokenomics 重新定義 AI 工廠價值:黃仁勛將所有輸出重新框架為 Token = Revenue,傳統工廠生產實體商品,AI 工廠改為生產 Token;對製造端而言,目標是以最低成本產生最多 Token,實現每投入 1 元帶回 3–5 元回報的商業邏輯。
  • 開源策略是市場放大器而非讓利:NVIDIA 釋出 Cosmos 3、Apomile 3 等開源模型,以及通用人型機器人,目的是降低新創進入自動駕駛、World Model、Physical AI 的門檻,擴大整體生態系規模,最終帶動更多算力與服務需求(「The more you buy, the more you earn」)。
  • Deal to Delivery Agent 解決中小企業流程瓶頸:Gary 團隊識別出企業收到客戶需求後,需跨工具手動完成報價、開票、GitHub issue、通知等重複性操作是最大效率殺手;Agent 自動拆解商機、建立 ERP 記錄並推送 Telegram 通知,人類只需在 Draft 狀態下做最終 Review 確認。
黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備
編輯精選
30 min
AI 技術中文6月20日

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備

Coco哥

  • QNX 擁有機器人 OS 三大不可替代技術門檻
  • Windows 響應延遲 200 毫秒,Linux 一旦核心崩潰全部失效,而 QNX 具備毫秒級即時決策、ISO 26262 ASIL-D 與 IEC 61508 SIL-3 最高安全認證,以及微型內核獨立架構(單一模組崩潰不影響其餘系統),三項條件同時達標,現階段競爭對手均未能複製。
  • 40 年護城河非短期可追趕