🚀Hermes Agent高级玩法之三大隐藏技能全公开！Ollama云端免费模型+Open WebUI美化界面+主副模型省Token配置，稳定性碾压小龙虾，一键部署免费云端模型完整教程，小白3分钟上手

AI超元域·4月21日週二·13 min中文

三句話摘要

透過 Ollama 整合與 OpenWebUI 介面，讓 Hermes Agent 實現免費模型、多端互動與省 Token 的完整進階用法。用 OpenWebUI 接管 Hermes Agent 的互動介面，再搭配 Gemini 2.5 Flash 承擔所有輔助任務，是目前體驗最佳、成本最低的 Hermes 使用組合。 Ollama 一鍵整合 Hermes：Ollama 已原生支援 Hermes Agent，用戶只需下載安裝 Ollama 並執行單一命令，即可傻瓜式啟動 Hermes 並接入免費雲端模型（如 MiniMax M2.7），完全不佔用本機 GPU 資源。

重點整理

重點

1
Ollama 一鍵整合 Hermes：Ollama 已原生支援 Hermes Agent，用戶只需下載安裝 Ollama 並執行單一命令，即可傻瓜式啟動 Hermes 並接入免費雲端模型（如 MiniMax M2.7），完全不佔用本機 GPU 資源。
2
OpenWebUI 解決聊天軟體的根本限制：大多數聊天工具無法解析 Markdown、對話記錄分散難查，OpenWebUI 原生整合 Hermes API，提供 ChatGPT 級別的介面體驗，同時支援代碼執行、語音朗讀、對話歷史全文搜尋。
3
手機端透過 LAN IP 直接存取：在手機瀏覽器輸入電腦 IP 加 8080 埠即可使用 OpenWebUI，支援上傳檔案、截圖、引用網頁與知識庫，達到聊天軟體無法實現的互動深度。
4
主副模型分工是省 Token 的關鍵：Hermes 支援在配置文件中為「核准、壓縮、記憶整理、MCP 呼叫、Skill、視覺、網頁擷取」等子任務各自指定不同模型，用便宜模型處理輕量任務，保留昂貴主模型給複雜推理。

實用技巧與重點

乾貨

Hermes Agent GitHub star 增速已超越 OpenCloud（小龍蝦）
免費模型方案：Ollama 雲端模型 MiniMax M2.7（不佔本地資源）
OpenWebUI 安裝：使用官方倉庫提供的單一 Docker 命令安裝
Hermes Gateway 啟用 API 需在配置文件新增兩行參數：① 啟用 API 服務、② 設定 API 密碼
OpenWebUI 連接設定：URL 填 `localhost:8642/`（尾部加斜線代表相容 OpenAI API），認證填設定的密碼
OpenWebUI 訪問埠：`localhost:8080`；手機使用 `電腦IP:8080`
Hermes 回報可呼叫 Skill 共 118 個
副模型推薦配置：Gemini 2.5 Flash，適用於批准、壓縮、記憶沖刷、MCP 呼叫、Skill、視覺、網頁擷取等全部輔助任務
其他可設定 API Key 來源：Google、MiniMax、OpenRouter
公網穿透方案提及：Ngrok 或其他開源內網穿透工具（本期未演示）
配置文件可用 Codex 或 Claude Code 等 Agent 以自然語言自動填寫

結論

“用 OpenWebUI 接管 Hermes Agent 的互動介面，再搭配 Gemini 2.5 Flash 承擔所有輔助任務，是目前體驗最佳、成本最低的 Hermes 使用組合。”

完整解析

詳細

Hermes Agent 近期在 GitHub 上的 star 增速已超越知名競品 OpenCloud（小龍蝦），其最大優勢在於穩定性——OpenCloud 每次版本更新都會引入大量 bug，而 Hermes 升版幾乎不會造成崩潰或功能異常。本期影片圍繞三個主題展開：免費模型接入、更好的互動介面，以及降低 Token 消耗的模型分工配置。

免費模型：用 Ollama 一鍵部署。Ollama 已將 Hermes Agent 內建整合，使用者只需至 Ollama 官網依作業系統下載安裝，再執行官方提供的單一命令，即可進入模型選擇介面。介面中提供數個帶有「Cloud」標示的模型，代表可直接使用 Ollama 雲端額度，例如 MiniMax M2.7，完全不消耗本機運算資源。這對想免費體驗 Hermes 卻不想自備 API Key 的使用者而言，是門檻最低的入門方案。

進階互動：以 OpenWebUI 取代聊天軟體。許多用戶習慣在微信等聊天工具中使用 Hermes，但這類平台存在根本性限制：不支援 Markdown 解析、對話記錄堆疊混亂、無法執行代碼。OpenWebUI 是一個開源專案，現已原生支援 Hermes API，安裝完成後只需在 Hermes 配置文件中新增兩行參數（啟用 API 服務 + 設定密碼），再透過 `localhost:8080` 開啟 OpenWebUI，設定連接到 `localhost:8642/` 並填入密碼即可。介面提供流式輸出、代碼一鍵執行、語音朗讀、回答重新生成，以及左側欄的對話歷史全文搜尋。手機端只需在瀏覽器輸入電腦 LAN IP 加 8080 埠，即可登入同一個 OpenWebUI 實例，支援上傳檔案、截圖、引用網頁與知識庫，互動深度遠超任何聊天軟體。若需從公網存取，可搭配 Ngrok 等工具進行內網穿透。

省 Token：主副模型分工配置。Hermes Agent 支援在配置文件中為不同子任務指定獨立模型，包括：核准（Approval）、記憶壓縮（Compression）、記憶沖刷（Memory Flush）、MCP 呼叫、Session 搜尋、Skill 執行、視覺任務、網頁擷取等。每個任務可分別指定 API Key、base URL、模型 ID 與模型提供商。講者實測後，將上述所有輔助任務統一設為 Google Gemini 2.5 Flash，效果已足夠應付日常使用，主模型則保留給真正複雜的推理任務，從而在不犧牲品質的前提下大幅壓低 Token 費用。配置文件也可直接交由 Codex 或 Claude Code 等 Agent 以自然語言指令自動填寫，無需手動編輯。

關鍵時刻

Pipeline v2

帶時間戳的重點，會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

🚀Hermes Agent高级玩法之三大隐藏技能全公开！Ollama云端免费模型+Open WebUI美化界面+主副模型省Token配置，稳定性碾压小龙虾，一键部署免费云端模型完整教程，小白3分钟上手

三句話摘要

重點整理

實用技巧與重點

結論

完整解析

關鍵時刻

事實查核

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手？

我贏得 NVIDIA GTC Taipei 2026 的金票啦！這 4 天展期會有什麼不一樣的體驗呢？ | Computex 2026

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備