KeyFrame
AI 技術編輯精選

How to Use GLM 5.2 For Free (Z.ai Open Source AI)

Jigs Dev·6月19日週五·3 min英文

三句話摘要

ZAI 推出開源免費的 GLM 5.2 模型,並示範如何在 VS Code 中透過 HuggingFace API 完整串接使用。 GLM 5.2 是目前性能最接近閉源旗艦的開源模型之一,透過 HuggingFace Router 五分鐘內即可免費接入 VS Code,API 成本更遠低於競品。 GLM 5.2 以開源模型挑戰閉源旗艦:在 SWE-Bench PRO 上得分 62.1,超過 GPT-4.5 與 Gemini 2.5 Pro,顯示開源模型在程式碼能力上已具備頂級競爭力,且無需付費訂閱。

重點整理

重點
  • 1

    GLM 5.2 以開源模型挑戰閉源旗艦:在 SWE-Bench PRO 上得分 62.1,超過 GPT-4.5 與 Gemini 2.5 Pro,顯示開源模型在程式碼能力上已具備頂級競爭力,且無需付費訂閱。

  • 2

    低成本 API 是核心優勢:相較於閉源模型,GLM 5.2 的 API 定價極低,適合開發者在不超支的情況下於產品中整合前沿推理能力。

  • 3

    HuggingFace Router 提供統一接入點:透過 `https://router.huggingface.co/v1` 作為 base URL,搭配 HuggingFace token,可將任何支援 Chat Completion 的開源模型直接接入 VS Code AI Chat,無需額外部署。

  • 4

    免費層有速率限制須留意:HuggingFace 免費額度在高頻使用時會觸發 rate limit,正式開發建議改用 ZAI 官方 Developer API。

實用技巧與重點

乾貨
  • 模型名稱:GLM 5.2(ZAI / 智譜 AI 發布)
  • 授權:MIT
  • SWE-Bench PRO 得分:62.1(超過 GPT-4.5、Gemini 2.5 Pro)
  • 組合推理基準得分:81.0(接近 Claude Opus)
  • API 定價:輸入 $1.40 / 百萬 token,輸出 $4.40 / 百萬 token
  • 免費試用入口:`ZAI.ai`、HuggingFace Model Page、HuggingChat
  • VS Code 串接步驟:
  • HuggingFace → Settings → Access Tokens → New Token(類型選 read)
  • VS Code → AI Chat → Model Picker → Settings → Add Model → Custom Endpoint
  • 名稱填 `GLM-5.2`,貼上 HuggingFace Token,類型選 Chat Completion
  • 開啟 `chatLanguageModels.json`,設定:
  • `id`: `Zai-Org/glm-5.2-novita`(或對應名稱)
  • `name`: `GLM-5.2`
  • `url`: `https://router.huggingface.co/v1`
  • 儲存後回到 AI Chat,從 Model Picker 選擇 GLM-5.2 即可使用
  • 取得正確 API URL 方法:至 HuggingFace 的 GLM 5.2 頁面 → Use this model → Curl,即可看到可用的 endpoint URL

結論

結論

GLM 5.2 是目前性能最接近閉源旗艦的開源模型之一,透過 HuggingFace Router 五分鐘內即可免費接入 VS Code,API 成本更遠低於競品。

完整解析

詳細

近期 AI 模型競賽不再只是閉源廠商的主場。ZAI(智譜 AI)推出的 GLM 5.2 以 MIT 授權發布,任何人都可以免費下載並檢視模型權重,這在性能逼近旗艦閉源模型的開源陣營中屬於值得關注的進展。從官方公布的基準數據來看,GLM 5.2 在 SWE-Bench Verified(軟體工程能力評測)上得分 62.1,不僅超越 GPT-4.5,也領先 Gemini 2.5 Pro;在組合推理基準上更達到 81.0,已非常接近 Claude Opus 的水準。這些數字代表,開發者在面對程式碼生成、系統設計等工程任務時,GLM 5.2 已成為一個具備實際競爭力的選項。

對於想直接體驗而不設置任何環境的使用者,最簡單的方式是前往 `ZAI.ai` 官網或 HuggingFace 上的 HuggingChat,皆可免費測試模型的對話與推理能力。若要在開發流程中整合,ZAI 提供的 Developer API 定價相當低廉:輸入端 $1.40 / 百萬 token,輸出端 $4.40 / 百萬 token,遠低於多數閉源模型,讓預算有限的開發者或獨立開發者也能負擔得起前沿推理能力。

影片的核心教學展示了如何在 VS Code 中透過 HuggingFace Inference Router 接入 GLM 5.2。整個流程分為兩段:首先在 HuggingFace 帳號的 Settings 中建立一個 read 類型的 Access Token;接著在 VS Code 的 AI Chat 擴充功能中,選擇 Custom Endpoint,將 Token 和模型資訊填入後,修改 `chatLanguageModels.json` 設定檔,將 base URL 指向 `https://router.huggingface.co/v1`,儲存即可完成串接。若不確定正確的模型 ID 或 URL 格式,可直接到 HuggingFace 上 GLM 5.2 的模型頁面,點擊「Use this model」並切換到 Curl 範例,即可取得可直接複製貼上的完整 endpoint 設定。

需要特別注意的是,透過 HuggingFace 免費層使用時,高頻請求會觸發速率限制(rate limit),不適合正式產品場景;若要穩定呼叫,建議改用 ZAI 官方的 Developer API,同時享有更低延遲與更穩定的服務品質。

關鍵時刻

Pipeline v2

帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手?
16 min
AI 技術中文6月20日

Claude Cowork vs Codex: 誰才是更好的AI工作助手?

李厂长来了

  • 介面設計哲學不同:Codework 以標籤頁區分聊天、文書與程式碼三種模式,任務彼此隔離不混淆;Codex 則將所有功能整合在單一介面,減少切換成本,但頁面相對雜亂。
  • 第三方整合能力差距明顯:Codework 提供大量連接器並支援 Zapier 擴展,且可針對每個連接器精細設定讀寫權限(如 Gmail 只讀免確認、寫信需批准);Codex 的插件數量較少且缺乏同等級的權限控制機制。
  • 定時任務管理方式影響長期使用體驗:Codework 將同一自動化任務的歷史記錄歸類在同一條目下,便於追蹤;Codex 每次執行都獨立列出,隨任務增多左側欄會越來越臃腫,不利於長期管理。
我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026
編輯精選
28 min
AI 技術中文6月20日

我贏得 NVIDIA GTC Taipei 2026 的金票啦!這 4 天展期會有什麼不一樣的體驗呢? | Computex 2026

EngineerGary

  • Tokenomics 重新定義 AI 工廠價值:黃仁勛將所有輸出重新框架為 Token = Revenue,傳統工廠生產實體商品,AI 工廠改為生產 Token;對製造端而言,目標是以最低成本產生最多 Token,實現每投入 1 元帶回 3–5 元回報的商業邏輯。
  • 開源策略是市場放大器而非讓利:NVIDIA 釋出 Cosmos 3、Apomile 3 等開源模型,以及通用人型機器人,目的是降低新創進入自動駕駛、World Model、Physical AI 的門檻,擴大整體生態系規模,最終帶動更多算力與服務需求(「The more you buy, the more you earn」)。
  • Deal to Delivery Agent 解決中小企業流程瓶頸:Gary 團隊識別出企業收到客戶需求後,需跨工具手動完成報價、開票、GitHub issue、通知等重複性操作是最大效率殺手;Agent 自動拆解商機、建立 ERP 記錄並推送 Telegram 通知,人類只需在 Draft 狀態下做最終 Review 確認。
黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備
編輯精選
30 min
AI 技術中文6月20日

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備

Coco哥

  • QNX 擁有機器人 OS 三大不可替代技術門檻
  • Windows 響應延遲 200 毫秒,Linux 一旦核心崩潰全部失效,而 QNX 具備毫秒級即時決策、ISO 26262 ASIL-D 與 IEC 61508 SIL-3 最高安全認證,以及微型內核獨立架構(單一模組崩潰不影響其餘系統),三項條件同時達標,現階段競爭對手均未能複製。
  • 40 年護城河非短期可追趕