KeyFrame

💯AI Agent 部署: Hermes Agent + 甲骨文云 + 谷歌云完整实战

MoneyMoneyHome·5月10日週日·18 min中文

三句話摘要

零成本架構:用甲骨文雲免費 ARM 伺服器托管 Hermes Agent,搭配 Google Cloud Vertex AI 呼叫 Gemini 模型,再接入 Telegram Bot,跑通完整 AI Agent 最小閉環。 --- 在 AI Agent 專案驗證前,用甲骨文雲免費 ARM 伺服器托管、Google Cloud 贈金驅動 Gemini,以零成本先跑通完整閉環,比任何設備投資都更有價值。 先驗證再投入,白嫖是風控而非貪便宜。 在專案尚未跑通前就購買 Mac mini、伺服器或充值 Token,屬於未驗證的沉沒成本;正確順序是先用免費資源讓最小閉環可用,確認可行後再談優化與商業化。

重點整理

重點
  • 1

    先驗證再投入,白嫖是風控而非貪便宜。 在專案尚未跑通前就購買 Mac mini、伺服器或充值 Token,屬於未驗證的沉沒成本;正確順序是先用免費資源讓最小閉環可用,確認可行後再談優化與商業化。

  • 2

    甲骨文雲 ARM 是免費 VPS 天花板,足以承載 Hermes Agent。 Hermes Agent 本身不需本地跑大語言模型,主要負責任務調度與工具執行,4 核 24G 記憶體的免費規格完全夠用,且服務可長期在線、不依賴本地電腦。

  • 3

    Vertex AI 與 Google AI Studio 的 API endpoint 不同,需手動替換。 Hermes 預設寫入的是 `generativelanguage` 開頭的 Google AI Studio 地址,Vertex AI 使用的是 `aiplatform` 開頭的 URL 並需帶入 project ID,兩者不相容,需覆蓋 `.env` 與 Gemini native adapter 才能正常通訊。

  • 4

    最小閉環的價值在於排錯順序清晰。 跑通後若出現問題,優先依照鏈路逐一排查:401 錯誤先查 Token 有效性與 project ID;依賴安裝報錯先確認 Linux ARM64 相容性;不要一開始就引入多餘複雜度。

  • 5

    --

實用技巧與重點

乾貨
  • 雲端資源
  • 甲骨文雲 Always Free ARM:最高 4 核 CPU、24G 記憶體,永久免費
  • Google Cloud 新帳號贈金:300 美元(影片演示時剩餘 250 美元)
  • 平台與工具
  • Hermes Agent(GitHub 開源,官方安裝命令一鍵部署)
  • Google Cloud Vertex AI(正式 AI 平台,非 Google AI Studio)
  • Gemini 模型:`gemini-3.1-pro-preview`(Quick Setup 時選擇)
  • Telegram Bot(透過 BotFather 申請 Token)
  • Vertex AI Base URL 格式
  • ```
  • https://aiplatform.googleapis.com/v1/projects/[YOUR_PROJECT_ID]/...
  • ```
  • (非 `generativelanguage` 開頭,安裝時需手動輸入)
  • 操作步驟
  • Google Cloud 建立新專案,關聯帳單帳戶
  • 啟用 Agent Platform API,建立 API Key
  • 記下 Project ID
  • SSH 登入甲骨文雲 ARM 伺服器
  • 執行 Hermes Agent 官方安裝命令
  • Quick Setup 選 Google AI Studio 類型,輸入 API Key 與 Vertex AI URL
  • 設定 Telegram Bot Token(BotFather 申請)
  • 修改 `~/hermes/.env`:替換 `GOOGLE_API_KEY` 與 `GEMINI_BASE_URL`
  • 覆蓋 Gemini native adapter 檔案至安裝路徑(`/usr/local/lib/hermes-agent/`)
  • 重啟 Hermes Agent,測試 CLI 與 Telegram 雙通道
  • 常見報錯排查清單
  • `401 invalid credential` / `permission denied`:檢查 Project ID、Vertex AI API 是否啟用、Token 是否過期
  • 依賴安裝失敗:確認映像檔支援 Linux ARM64
  • --

結論

結論

在 AI Agent 專案驗證前,用甲骨文雲免費 ARM 伺服器托管、Google Cloud 贈金驅動 Gemini,以零成本先跑通完整閉環,比任何設備投資都更有價值。

完整解析

詳細

許多人一聽到 AI Agent 就陷入「要不要買 Mac mini、要不要充值 Token」的焦慮,但講者的核心觀點是:在專案閉環尚未驗通之前,投入資金等同於繳學費。正確的策略是先用零成本資源跑通最小可行路徑,確認整條鏈路有效後,才有優化的依據。這套方案的三個支柱分別是:甲骨文雲 Always Free ARM 伺服器提供「身體」、Google Cloud Vertex AI 提供「大腦(Gemini 模型)」、Hermes Agent 負責把兩者串連起來執行任務。

架構層面,完整的資料流如下:使用者在 Telegram 輸入任務 → Telegram Bot 將訊息轉給甲骨文雲 ARM 上的 Hermes Agent → Hermes Agent 使用 Google Cloud Token 呼叫 Vertex AI → Vertex AI 調用 Gemini 模型推理 → 結果回傳至 Telegram。甲骨文雲之所以選 ARM 機型,是因為其 Always Free 方案最高可達 4 核 CPU、24G 記憶體,在免費 VPS 中屬天花板規格,而 Hermes Agent 本身不需在本機跑大語言模型,主要負責任務調度與工具執行,這個規格完全充裕。

實際部署流程分為三段。第一段在 Google Cloud 側:建立新專案(影片示範名稱為 `hermes-2026-05-09`),關聯帳單帳戶確認贈金已綁定,接著啟用 Agent Platform API,建立 API Key,並記下 Project ID 備用。第二段在甲骨文雲 ARM 伺服器:SSH 登入後執行 Hermes Agent 官方 GitHub 的一鍵安裝命令,Quick Setup 時選擇 Google AI Studio 類型,輸入 API Key,並手動填入 Vertex AI 的 base URL(格式為 `aiplatform` 開頭並帶入自己的 project ID,與預設的 `generativelanguage` 不同)。接著設定 Telegram Bot Token(透過 BotFather 新增機器人取得),完成初始安裝後啟動服務。

然而,初次啟動後測試會立即出現報錯,原因是 Hermes 預設的 Google AI Studio endpoint 與 Vertex AI 不相容。解決方法是修改 `~/hermes/.env` 中的 `GOOGLE_API_KEY` 與 `GEMINI_BASE_URL` 兩個欄位,並將預先準備好的 Gemini native adapter 檔案覆蓋至 Hermes 安裝路徑(`/usr/local/lib/hermes-agent/`)。重啟後,CLI 端與 Telegram Bot 雙通道均可正常與 Gemini 模型通訊,包含天氣查詢、日期識別等工具呼叫均測試通過。

影片最後提醒四個注意事項:免費資源需合規使用,不可濫用;300 美元贈金適合學習驗證,非永久額度;Token 有效期需定期確認,遇 401 錯誤依序排查 project ID、API 啟用狀態與 Token;ARM64 架構安裝依賴或 Docker 映像時需確認 Linux ARM64 相容性。講者強調,這些問題都不複雜,關鍵在於按照鏈路順序逐步排查,而不是一開始就堆疊複雜度。

---

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手?
16 min
AI 技術中文6月20日

Claude Cowork vs Codex: 誰才是更好的AI工作助手?

李厂长来了

  • 介面設計哲學不同:Codework 以標籤頁區分聊天、文書與程式碼三種模式,任務彼此隔離不混淆;Codex 則將所有功能整合在單一介面,減少切換成本,但頁面相對雜亂。
  • 第三方整合能力差距明顯:Codework 提供大量連接器並支援 Zapier 擴展,且可針對每個連接器精細設定讀寫權限(如 Gmail 只讀免確認、寫信需批准);Codex 的插件數量較少且缺乏同等級的權限控制機制。
  • 定時任務管理方式影響長期使用體驗:Codework 將同一自動化任務的歷史記錄歸類在同一條目下,便於追蹤;Codex 每次執行都獨立列出,隨任務增多左側欄會越來越臃腫,不利於長期管理。
我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026
編輯精選
28 min
AI 技術中文6月20日

我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026

EngineerGary

  • Tokenomics 重新定義 AI 工廠價值:黃仁勛將所有輸出重新框架為 Token = Revenue,傳統工廠生產實體商品,AI 工廠改為生產 Token;對製造端而言,目標是以最低成本產生最多 Token,實現每投入 1 元帶回 3–5 元回報的商業邏輯。
  • 開源策略是市場放大器而非讓利:NVIDIA 釋出 Cosmos 3、Apomile 3 等開源模型,以及通用人型機器人,目的是降低新創進入自動駕駛、World Model、Physical AI 的門檻,擴大整體生態系規模,最終帶動更多算力與服務需求(「The more you buy, the more you earn」)。
  • Deal to Delivery Agent 解決中小企業流程瓶頸:Gary 團隊識別出企業收到客戶需求後,需跨工具手動完成報價、開票、GitHub issue、通知等重複性操作是最大效率殺手;Agent 自動拆解商機、建立 ERP 記錄並推送 Telegram 通知,人類只需在 Draft 狀態下做最終 Review 確認。
黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備
編輯精選
30 min
AI 技術中文6月20日

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備

Coco哥

  • QNX 擁有機器人 OS 三大不可替代技術門檻
  • Windows 響應延遲 200 毫秒,Linux 一旦核心崩潰全部失效,而 QNX 具備毫秒級即時決策、ISO 26262 ASIL-D 與 IEC 61508 SIL-3 最高安全認證,以及微型內核獨立架構(單一模組崩潰不影響其餘系統),三項條件同時達標,現階段競爭對手均未能複製。
  • 40 年護城河非短期可追趕