KeyFrame

🚀Hermes Agent高级玩法之三大隐藏技能全公开!Ollama云端免费模型+Open WebUI美化界面+主副模型省Token配置,稳定性碾压小龙虾,一键部署免费云端模型完整教程,小白3分钟上手

AI超元域·4月21日週二·13 min中文

三句話摘要

透過 Ollama 整合與 OpenWebUI 介面,讓 Hermes Agent 實現免費模型、多端互動與省 Token 的完整進階用法。 用 OpenWebUI 接管 Hermes Agent 的互動介面,再搭配 Gemini 2.5 Flash 承擔所有輔助任務,是目前體驗最佳、成本最低的 Hermes 使用組合。 Ollama 一鍵整合 Hermes:Ollama 已原生支援 Hermes Agent,用戶只需下載安裝 Ollama 並執行單一命令,即可傻瓜式啟動 Hermes 並接入免費雲端模型(如 MiniMax M2.7),完全不佔用本機 GPU 資源。

重點整理

重點
  • 1

    Ollama 一鍵整合 Hermes:Ollama 已原生支援 Hermes Agent,用戶只需下載安裝 Ollama 並執行單一命令,即可傻瓜式啟動 Hermes 並接入免費雲端模型(如 MiniMax M2.7),完全不佔用本機 GPU 資源。

  • 2

    OpenWebUI 解決聊天軟體的根本限制:大多數聊天工具無法解析 Markdown、對話記錄分散難查,OpenWebUI 原生整合 Hermes API,提供 ChatGPT 級別的介面體驗,同時支援代碼執行、語音朗讀、對話歷史全文搜尋。

  • 3

    手機端透過 LAN IP 直接存取:在手機瀏覽器輸入電腦 IP 加 8080 埠即可使用 OpenWebUI,支援上傳檔案、截圖、引用網頁與知識庫,達到聊天軟體無法實現的互動深度。

  • 4

    主副模型分工是省 Token 的關鍵:Hermes 支援在配置文件中為「核准、壓縮、記憶整理、MCP 呼叫、Skill、視覺、網頁擷取」等子任務各自指定不同模型,用便宜模型處理輕量任務,保留昂貴主模型給複雜推理。

實用技巧與重點

乾貨
  • Hermes Agent GitHub star 增速已超越 OpenCloud(小龍蝦)
  • 免費模型方案:Ollama 雲端模型 MiniMax M2.7(不佔本地資源)
  • OpenWebUI 安裝:使用官方倉庫提供的單一 Docker 命令安裝
  • Hermes Gateway 啟用 API 需在配置文件新增兩行參數:① 啟用 API 服務、② 設定 API 密碼
  • OpenWebUI 連接設定:URL 填 `localhost:8642/`(尾部加斜線代表相容 OpenAI API),認證填設定的密碼
  • OpenWebUI 訪問埠:`localhost:8080`;手機使用 `電腦IP:8080`
  • Hermes 回報可呼叫 Skill 共 118 個
  • 副模型推薦配置:Gemini 2.5 Flash,適用於批准、壓縮、記憶沖刷、MCP 呼叫、Skill、視覺、網頁擷取等全部輔助任務
  • 其他可設定 API Key 來源:Google、MiniMax、OpenRouter
  • 公網穿透方案提及:Ngrok 或其他開源內網穿透工具(本期未演示)
  • 配置文件可用 Codex 或 Claude Code 等 Agent 以自然語言自動填寫

結論

結論

用 OpenWebUI 接管 Hermes Agent 的互動介面,再搭配 Gemini 2.5 Flash 承擔所有輔助任務,是目前體驗最佳、成本最低的 Hermes 使用組合。

完整解析

詳細

Hermes Agent 近期在 GitHub 上的 star 增速已超越知名競品 OpenCloud(小龍蝦),其最大優勢在於穩定性——OpenCloud 每次版本更新都會引入大量 bug,而 Hermes 升版幾乎不會造成崩潰或功能異常。本期影片圍繞三個主題展開:免費模型接入、更好的互動介面,以及降低 Token 消耗的模型分工配置。

免費模型:用 Ollama 一鍵部署。Ollama 已將 Hermes Agent 內建整合,使用者只需至 Ollama 官網依作業系統下載安裝,再執行官方提供的單一命令,即可進入模型選擇介面。介面中提供數個帶有「Cloud」標示的模型,代表可直接使用 Ollama 雲端額度,例如 MiniMax M2.7,完全不消耗本機運算資源。這對想免費體驗 Hermes 卻不想自備 API Key 的使用者而言,是門檻最低的入門方案。

進階互動:以 OpenWebUI 取代聊天軟體。許多用戶習慣在微信等聊天工具中使用 Hermes,但這類平台存在根本性限制:不支援 Markdown 解析、對話記錄堆疊混亂、無法執行代碼。OpenWebUI 是一個開源專案,現已原生支援 Hermes API,安裝完成後只需在 Hermes 配置文件中新增兩行參數(啟用 API 服務 + 設定密碼),再透過 `localhost:8080` 開啟 OpenWebUI,設定連接到 `localhost:8642/` 並填入密碼即可。介面提供流式輸出、代碼一鍵執行、語音朗讀、回答重新生成,以及左側欄的對話歷史全文搜尋。手機端只需在瀏覽器輸入電腦 LAN IP 加 8080 埠,即可登入同一個 OpenWebUI 實例,支援上傳檔案、截圖、引用網頁與知識庫,互動深度遠超任何聊天軟體。若需從公網存取,可搭配 Ngrok 等工具進行內網穿透。

省 Token:主副模型分工配置。Hermes Agent 支援在配置文件中為不同子任務指定獨立模型,包括:核准(Approval)、記憶壓縮(Compression)、記憶沖刷(Memory Flush)、MCP 呼叫、Session 搜尋、Skill 執行、視覺任務、網頁擷取等。每個任務可分別指定 API Key、base URL、模型 ID 與模型提供商。講者實測後,將上述所有輔助任務統一設為 Google Gemini 2.5 Flash,效果已足夠應付日常使用,主模型則保留給真正複雜的推理任務,從而在不犧牲品質的前提下大幅壓低 Token 費用。配置文件也可直接交由 Codex 或 Claude Code 等 Agent 以自然語言指令自動填寫,無需手動編輯。

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手?
16 min
AI 技術中文6月20日

Claude Cowork vs Codex: 誰才是更好的AI工作助手?

李厂长来了

  • 介面設計哲學不同:Codework 以標籤頁區分聊天、文書與程式碼三種模式,任務彼此隔離不混淆;Codex 則將所有功能整合在單一介面,減少切換成本,但頁面相對雜亂。
  • 第三方整合能力差距明顯:Codework 提供大量連接器並支援 Zapier 擴展,且可針對每個連接器精細設定讀寫權限(如 Gmail 只讀免確認、寫信需批准);Codex 的插件數量較少且缺乏同等級的權限控制機制。
  • 定時任務管理方式影響長期使用體驗:Codework 將同一自動化任務的歷史記錄歸類在同一條目下,便於追蹤;Codex 每次執行都獨立列出,隨任務增多左側欄會越來越臃腫,不利於長期管理。
我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026
編輯精選
28 min
AI 技術中文6月20日

我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026

EngineerGary

  • Tokenomics 重新定義 AI 工廠價值:黃仁勛將所有輸出重新框架為 Token = Revenue,傳統工廠生產實體商品,AI 工廠改為生產 Token;對製造端而言,目標是以最低成本產生最多 Token,實現每投入 1 元帶回 3–5 元回報的商業邏輯。
  • 開源策略是市場放大器而非讓利:NVIDIA 釋出 Cosmos 3、Apomile 3 等開源模型,以及通用人型機器人,目的是降低新創進入自動駕駛、World Model、Physical AI 的門檻,擴大整體生態系規模,最終帶動更多算力與服務需求(「The more you buy, the more you earn」)。
  • Deal to Delivery Agent 解決中小企業流程瓶頸:Gary 團隊識別出企業收到客戶需求後,需跨工具手動完成報價、開票、GitHub issue、通知等重複性操作是最大效率殺手;Agent 自動拆解商機、建立 ERP 記錄並推送 Telegram 通知,人類只需在 Draft 狀態下做最終 Review 確認。
黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備
編輯精選
30 min
AI 技術中文6月20日

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備

Coco哥

  • QNX 擁有機器人 OS 三大不可替代技術門檻
  • Windows 響應延遲 200 毫秒,Linux 一旦核心崩潰全部失效,而 QNX 具備毫秒級即時決策、ISO 26262 ASIL-D 與 IEC 61508 SIL-3 最高安全認證,以及微型內核獨立架構(單一模組崩潰不影響其餘系統),三項條件同時達標,現階段競爭對手均未能複製。
  • 40 年護城河非短期可追趕