Gemini 已經過時?2026 必須了解 AI Agent|Manus / Claude Cowork 教學|中小企必學「虛擬員工」
三句話摘要
AI Agent 與傳統 AI 助手(如 Gemini)的本質差異,並以 Cowork 與 Manus 實機示範 Agent 的自主執行、技能封裝與跨平台整合能力。 --- AI Agent 的核心價值不在於比 Gemini 更聰明,而在於能自主規劃、執行、串接外部系統,真正成為替你「做完事」的 AI 員工,而非只是給建議的顧問。 AI Agent 的核心價值是執行,而非回答:傳統 AI 助手如 Gemini 以問答為主,給出大量文字後仍需人工轉換為 Excel 或 PowerPoint;AI Agent 則自行規劃步驟、調用工具、寫入真實檔案,直接替代人工完成任務,且失敗時會自動嘗試其他方法。
重點整理
重點- 1
AI Agent 的核心價值是執行,而非回答:傳統 AI 助手如 Gemini 以問答為主,給出大量文字後仍需人工轉換為 Excel 或 PowerPoint;AI Agent 則自行規劃步驟、調用工具、寫入真實檔案,直接替代人工完成任務,且失敗時會自動嘗試其他方法。
- 2
Skill 是可移植的多步驟工作流程套件:Skill 不是單一 prompt,而是包含多個執行階段與可執行程式碼的工作封裝,可在 Manus、Cowork 等不同 Agent 之間以 ZIP 格式移植安裝,實現跨平台能力共用。
- 3
Manus 的知識庫機制比 Gemini 的 Gem 更自然:Manus 在日常工作中自動偵測用戶的重複偏好並儲存為「知識」,同時記錄「使用時機」,下次執行類似任務時自動調用,無需用戶主動設定專屬助手。Gemini 的 Gem 則需要用戶手動建立並輸入 prompt。
- 4
Connector 讓 AI Agent 成為跨平台整合樞紐:透過 Connector 串接外部服務,AI Agent 可自動完成「客戶透過 PayPal 付款 → 建立 Excel 存入 Jobbox → 調用 Gmail 寄出感謝信」等跨系統工作流,真正實現辦公室端對端自動化。
- 5
--
實用技巧與重點
乾貨- 工具與平台
- Cowork(Claude AI Agent,安裝於本機的桌面 App,非瀏覽器)
- Manus AI(辦公室型 AI Agent,具備知識庫與 Skill 系統)
- Minimax(第三方 TTS 服務,提供廣東話專業女聲)
- 外部 Connector 平台:Jobbox、PayPal、Gmail、Minimax(數量「數之不盡」)
- 下集預告工具:Anti-Gravity(疑為 Anthropic 相關編程工具)、Google AI Studio、n8n
- 具體數據與案例
- 名片 Demo:9 張名片圖片 → Cowork 自動呼叫 Python script 生成 Excel,全程無需人工介入
- 電子書案例:200 頁 PDF(Gemini 應用天書),Cowork 生成耗時 20 分鐘,事後人工整理約 1.5 天
- Manus 自動記憶的 Facebook 貼文偏好包含:強調反差、控制字數、金句獨立成行、短句適合手機閱讀
- Skill 技術細節
- 格式為 `skill.md`,內含多階段 prompt(示範中為 5 個階段)及可執行程式碼
- 打包格式為 ZIP,可從 Manus 下載後直接上傳至 Cowork 安裝
- Minimax 廣東話 TTS Skill 跨 Agent 移植測試:成功(但講者提醒不保證通用,常需 fine-tune 或修改程式碼)
- AI Agent 錯誤自我修復:任務失敗時自動改用其他方法,無需人工介入
- --
結論
結論“AI Agent 的核心價值不在於比 Gemini 更聰明,而在於能自主規劃、執行、串接外部系統,真正成為替你「做完事」的 AI 員工,而非只是給建議的顧問。”
完整解析
詳細2026 年第一季,AI 工具的生態已從「通用助手」走向「分工明確的專業工具」。影片作者以此為背景,深入比較 AI Agent 與傳統 AI 助手的根本差異,並以 Cowork 和 Manus 兩款工具進行實機示範。
傳統 AI 助手(以 Gemini 為例)的使用模式是問答式:用戶提問,AI 給出文字,用戶再自行將內容轉換為 Excel、PowerPoint 或其他格式。當需要連接外部系統時,Gemini 的限制更加明顯——例如自動查詢網店收款狀態,在現有架構下並不容易實現。這種模式讓 Gemini 像是「一個聰明但被困在孤島上的人」,只能靠問答提供服務。AI Agent 的定位則截然不同:它不以回答問題為核心,而是聚焦於任務執行。
第一個示範使用 Cowork(一款安裝於本機的桌面應用,非瀏覽器工具)。作者將一批名片圖片的資料夾授權給 Cowork,下達一句指令:「請將資料夾內的名片資訊抽取並寫入 Excel」。Cowork 隨即自行規劃步驟——先讀取圖片、抽取文字資訊,再呼叫 Excel skill,並在過程中自動撰寫 Python script 建立檔案。整個過程中,作者只需在初始授權時給予確認,其餘全部由 Agent 自主完成,最終輸出一份格式完整的 Excel 表,涵蓋所有 9 張名片的資訊。Cowork 的另一個關鍵特性是錯誤自我修復:若某個方法執行失敗,它會自動改用其他方式重試,全程無需人工介入。
第二個示範切換至 Manus,難度更高。作者僅貼入一篇英文文章的 URL,加上一句「請改寫成 Facebook 貼文」,沒有提供任何格式要求。Manus 首先控制本機瀏覽器開啟網頁讀取文章,接著自動上網搜尋補充素材,然後提出三個改寫方向讓用戶選擇,確認後才開始撰寫。完成文字後,Manus 進一步提供配圖方案:選用官方形象圖或以 Nanobala 生成 AI 圖片,並自動撰寫程式將文字疊加至圖片上,產出可直接發佈的 Facebook 貼文。這一切的背後,是 Manus 的「知識庫」機制在運作——它在過往多次協助撰寫 Facebook 貼文的過程中,自動記憶了作者的偏好(如短句、金句獨立成行、強調反差等),並在這次任務中自動調用,無需重新說明。這與 Gemini 需要用戶手動建立 Gem 的方式形成鮮明對比。
影片後半段深入講解 Skill 與 Connector 兩個核心機制。Skill 是多步驟工作流程的封裝,內含各階段的 prompt 與可執行程式碼,以 `.md` 格式儲存,可打包為 ZIP 在不同 Agent 間移植。作者以 Minimax 廣東話 TTS Skill 為例,展示從 Manus 建立 Skill、下載 ZIP、上傳至 Cowork,並成功執行語音生成的完整流程——雖然移植成功率並非百分百,實際應用中常需調整。Connector 則讓 Agent 能串接 Jobbox、PayPal、Gmail 等外部平台,從根本上擴展了 Agent 的「手腳」,使其能跨系統完成完整的業務流程。影片最後,作者分享個人偏好:Cowork 操作流暢適合一般任務(曾以 20 分鐘生成 200 頁 PDF 電子書),Manus 則更擅長辦公室類型的精細工作。
---
關鍵時刻
Pipeline v2帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。
事實查核
Pipeline v2說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。


