KeyFrame

Hermes Agent 入門:會自我進化的 AI Agent,Hermes + Telegram 實戰

QiQi Learns AI·4月10日週五·6 min中文

三句話摘要

介紹開源 AI Agent「Hermes Agent」的核心機制、與 OpenCloud 的差異,以及從安裝到接入 Telegram 的完整入門流程。 --- 若需要生態豐富、開箱即用,選 OpenCloud;若追求自主進化、記憶不丟、安全更嚴,Hermes Agent 是更值得長期培養的選擇。 1. 自學習技能(Skill)是核心差異

重點整理

重點
  • 1

    1. 自學習技能(Skill)是核心差異

  • 2

    Hermes Agent 會在使用者重複執行同類任務後,自動將成功流程封裝成 Skill 並持續優化,而非依賴社群現成庫——這讓它越用越貼合個人工作流,而非靜態工具。

  • 3

    2. 多層記憶系統讓 Agent 有連續性

  • 4

    系統採 Memory 文件存關鍵摘要、資料庫存完整歷史的雙軌架構,支援全文搜索與摘要召回,解決了 OpenCloud 以 Markdown 存檔導致跨對話記憶薄弱的問題。

  • 5

    3. OpenCloud vs Hermes 設計哲學根本不同

  • 6

    OpenCloud 是「Gateway 網關模式」,重平台調度與生態(1 萬+ Skill);Hermes 是「Engine 引擎模式」,重自主執行循環與持續進化——兩者目標用戶不同,不是替代關係。

  • 7

    4. 安全機制預設更嚴格

  • 8

    Hermes 內建使用者授權、危險命令審批、容器隔離、輸入過濾、上下文注入掃描共 5 層防禦,相較於 OpenCloud 曾發生 3 萬+ 實例暴露、300+ 惡意 Skill 的事件,防禦縱深更深。

  • 9

    --

實用技巧與重點

乾貨
  • 對比數據
  • OpenCloud GitHub 星數:35 萬顆(2025 年最火開源專案)
  • OpenCloud CloudHub 現成 Skill 數量:10,000+
  • OpenCloud 安全事件:3 萬多個實例暴露,300+ 惡意 Skill 被發現
  • Hermes 內建工具數量:40+
  • Hermes 記憶容量上限:無上限
  • 工具 / 平台名稱
  • Hermes Agent、OpenCloud
  • 支援模型:Claude、GPT、Gemini、Ollama(本地)、MiniMax
  • Telegram 接入工具:BotFather、Ask It It's Bot(取得 User ID)
  • 遷移工具:Hermes Cloud Migrate(一鍵從 OpenCloud 遷移)
  • Hermes 主循環五步驟
  • 執行任務(調用工具完成流程)
  • 評估結果(判斷本次執行是否有保存價值)
  • 抽象成 Skill(封裝或優化已有 Skill)
  • 寫入記憶(關鍵資訊存入多層記憶系統)
  • 自動召回(下次對話自動加載記憶與 Skill)
  • 安裝前提條件
  • 需預裝:Git
  • 支援系統:Linux、macOS、Docker
  • 安裝後自動處理:Python、Node.js、所有依賴、全局 `hermes` 命令
  • Telegram 配置流程
  • BotFather → `/newbot` → 填寫名稱與 Username(須以 `bot` 結尾)→ 取得 Bot Token
  • 搜索 Ask It It's Bot → 發送訊息 → 取得自己的 User ID
  • 執行 `hermes config` → Provider 選 Telegram → 填入 Bot Token + User ID → 選 Y 開機自啟
  • --

結論

結論

若需要生態豐富、開箱即用,選 OpenCloud;若追求自主進化、記憶不丟、安全更嚴,Hermes Agent 是更值得長期培養的選擇。

完整解析

詳細

Hermes Agent 是由 News Research 團隊開發的開源 AI Agent,設計為全天候跑在使用者自有伺服器上的自主執行系統。它的誕生背景正是對現有主流方案的反思:GitHub 上累積 35 萬星的 OpenCloud 雖然生態龐大,但本質上是一個「網關模式」的平台——它把各種渠道、工具、現成 Skill 集中調度,像一個多功能的個人作業系統。Hermes Agent 走的則是完全不同的「引擎模式」,強調執行循環優先,讓 Agent 在每次使用中不斷自我進化。

Hermes 的核心機制是一套可追蹤的閉環學習系統,分為五個步驟:執行任務、評估結果、抽象成 Skill、寫入記憶、自動召回,然後回到第一步持續循環。具體來說,當使用者重複讓它執行同類任務,系統會自動判斷這個流程有無封裝價值,若有則提煉成一個 Skill 並在後續使用中持續優化。這與 OpenCloud 依靠社群 CloudHub 提供 1 萬多個現成 Skill 的路徑截然不同——前者是「現成多」,後者是「越用越聰明」。記憶系統同樣如此:OpenCloud 以 Markdown 文件存儲,透明易讀但跨對話記憶能力有限;Hermes 採資料庫加檢索的雙軌架構,Memory 文件存關鍵摘要,資料庫存完整歷史,支援全文搜索,且跨 Session 無容量上限。

安全性方面,OpenCloud 曾發生超過 3 萬個實例暴露、300 多個惡意 Skill 被植入的事件,現已加入 Security Audit 命令應對。Hermes 則從設計層面預設了 5 層防禦:使用者授權、危險命令審批、容器隔離、輸入過濾、上下文注入掃描,整體縱深更深。在模型支援上,Hermes 可接入任意主流模型(Claude、GPT、Gemini、Ollama 本地模型),程式碼完全跑在自有伺服器,不需將任何內容上傳至第三方。

安裝流程極為精簡:確保機器上有 Git 後,一行命令即可完成安裝,Python、Node.js 及所有依賴均自動處理,並建立全局 `hermes` 命令。配置時透過交互選單選擇模型供應商(影片示範選用 MiniMax),填入 API Key 即完成模型設定。接入 Telegram 需三步:透過 BotFather 建立 Bot 取得 Token,透過 Ask It It's Bot 取得自己的 User ID,最後執行配置命令填入兩組資訊並設定開機自啟,啟動後向 Bot 發訊息收到回覆即代表連通成功。

---

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手?
16 min
AI 技術中文6月20日

Claude Cowork vs Codex: 誰才是更好的AI工作助手?

李厂长来了

  • 介面設計哲學不同:Codework 以標籤頁區分聊天、文書與程式碼三種模式,任務彼此隔離不混淆;Codex 則將所有功能整合在單一介面,減少切換成本,但頁面相對雜亂。
  • 第三方整合能力差距明顯:Codework 提供大量連接器並支援 Zapier 擴展,且可針對每個連接器精細設定讀寫權限(如 Gmail 只讀免確認、寫信需批准);Codex 的插件數量較少且缺乏同等級的權限控制機制。
  • 定時任務管理方式影響長期使用體驗:Codework 將同一自動化任務的歷史記錄歸類在同一條目下,便於追蹤;Codex 每次執行都獨立列出,隨任務增多左側欄會越來越臃腫,不利於長期管理。
我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026
編輯精選
28 min
AI 技術中文6月20日

我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026

EngineerGary

  • Tokenomics 重新定義 AI 工廠價值:黃仁勛將所有輸出重新框架為 Token = Revenue,傳統工廠生產實體商品,AI 工廠改為生產 Token;對製造端而言,目標是以最低成本產生最多 Token,實現每投入 1 元帶回 3–5 元回報的商業邏輯。
  • 開源策略是市場放大器而非讓利:NVIDIA 釋出 Cosmos 3、Apomile 3 等開源模型,以及通用人型機器人,目的是降低新創進入自動駕駛、World Model、Physical AI 的門檻,擴大整體生態系規模,最終帶動更多算力與服務需求(「The more you buy, the more you earn」)。
  • Deal to Delivery Agent 解決中小企業流程瓶頸:Gary 團隊識別出企業收到客戶需求後,需跨工具手動完成報價、開票、GitHub issue、通知等重複性操作是最大效率殺手;Agent 自動拆解商機、建立 ERP 記錄並推送 Telegram 通知,人類只需在 Draft 狀態下做最終 Review 確認。
黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備
編輯精選
30 min
AI 技術中文6月20日

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備

Coco哥

  • QNX 擁有機器人 OS 三大不可替代技術門檻
  • Windows 響應延遲 200 毫秒,Linux 一旦核心崩潰全部失效,而 QNX 具備毫秒級即時決策、ISO 26262 ASIL-D 與 IEC 61508 SIL-3 最高安全認證,以及微型內核獨立架構(單一模組崩潰不影響其餘系統),三項條件同時達標,現階段競爭對手均未能複製。
  • 40 年護城河非短期可追趕