How to Use GLM 5.2 For Free (Z.ai Open Source AI)
三句話摘要
ZAI 推出開源免費的 GLM 5.2 模型,並示範如何在 VS Code 中透過 HuggingFace API 完整串接使用。 GLM 5.2 是目前性能最接近閉源旗艦的開源模型之一,透過 HuggingFace Router 五分鐘內即可免費接入 VS Code,API 成本更遠低於競品。 GLM 5.2 以開源模型挑戰閉源旗艦:在 SWE-Bench PRO 上得分 62.1,超過 GPT-4.5 與 Gemini 2.5 Pro,顯示開源模型在程式碼能力上已具備頂級競爭力,且無需付費訂閱。
重點整理
重點- 1
GLM 5.2 以開源模型挑戰閉源旗艦:在 SWE-Bench PRO 上得分 62.1,超過 GPT-4.5 與 Gemini 2.5 Pro,顯示開源模型在程式碼能力上已具備頂級競爭力,且無需付費訂閱。
- 2
低成本 API 是核心優勢:相較於閉源模型,GLM 5.2 的 API 定價極低,適合開發者在不超支的情況下於產品中整合前沿推理能力。
- 3
HuggingFace Router 提供統一接入點:透過 `https://router.huggingface.co/v1` 作為 base URL,搭配 HuggingFace token,可將任何支援 Chat Completion 的開源模型直接接入 VS Code AI Chat,無需額外部署。
- 4
免費層有速率限制須留意:HuggingFace 免費額度在高頻使用時會觸發 rate limit,正式開發建議改用 ZAI 官方 Developer API。
實用技巧與重點
乾貨- 模型名稱:GLM 5.2(ZAI / 智譜 AI 發布)
- 授權:MIT
- SWE-Bench PRO 得分:62.1(超過 GPT-4.5、Gemini 2.5 Pro)
- 組合推理基準得分:81.0(接近 Claude Opus)
- API 定價:輸入 $1.40 / 百萬 token,輸出 $4.40 / 百萬 token
- 免費試用入口:`ZAI.ai`、HuggingFace Model Page、HuggingChat
- VS Code 串接步驟:
- HuggingFace → Settings → Access Tokens → New Token(類型選 read)
- VS Code → AI Chat → Model Picker → Settings → Add Model → Custom Endpoint
- 名稱填 `GLM-5.2`,貼上 HuggingFace Token,類型選 Chat Completion
- 開啟 `chatLanguageModels.json`,設定:
- `id`: `Zai-Org/glm-5.2-novita`(或對應名稱)
- `name`: `GLM-5.2`
- `url`: `https://router.huggingface.co/v1`
- 儲存後回到 AI Chat,從 Model Picker 選擇 GLM-5.2 即可使用
- 取得正確 API URL 方法:至 HuggingFace 的 GLM 5.2 頁面 → Use this model → Curl,即可看到可用的 endpoint URL
結論
結論“GLM 5.2 是目前性能最接近閉源旗艦的開源模型之一,透過 HuggingFace Router 五分鐘內即可免費接入 VS Code,API 成本更遠低於競品。”
完整解析
詳細近期 AI 模型競賽不再只是閉源廠商的主場。ZAI(智譜 AI)推出的 GLM 5.2 以 MIT 授權發布,任何人都可以免費下載並檢視模型權重,這在性能逼近旗艦閉源模型的開源陣營中屬於值得關注的進展。從官方公布的基準數據來看,GLM 5.2 在 SWE-Bench Verified(軟體工程能力評測)上得分 62.1,不僅超越 GPT-4.5,也領先 Gemini 2.5 Pro;在組合推理基準上更達到 81.0,已非常接近 Claude Opus 的水準。這些數字代表,開發者在面對程式碼生成、系統設計等工程任務時,GLM 5.2 已成為一個具備實際競爭力的選項。
對於想直接體驗而不設置任何環境的使用者,最簡單的方式是前往 `ZAI.ai` 官網或 HuggingFace 上的 HuggingChat,皆可免費測試模型的對話與推理能力。若要在開發流程中整合,ZAI 提供的 Developer API 定價相當低廉:輸入端 $1.40 / 百萬 token,輸出端 $4.40 / 百萬 token,遠低於多數閉源模型,讓預算有限的開發者或獨立開發者也能負擔得起前沿推理能力。
影片的核心教學展示了如何在 VS Code 中透過 HuggingFace Inference Router 接入 GLM 5.2。整個流程分為兩段:首先在 HuggingFace 帳號的 Settings 中建立一個 read 類型的 Access Token;接著在 VS Code 的 AI Chat 擴充功能中,選擇 Custom Endpoint,將 Token 和模型資訊填入後,修改 `chatLanguageModels.json` 設定檔,將 base URL 指向 `https://router.huggingface.co/v1`,儲存即可完成串接。若不確定正確的模型 ID 或 URL 格式,可直接到 HuggingFace 上 GLM 5.2 的模型頁面,點擊「Use this model」並切換到 Curl 範例,即可取得可直接複製貼上的完整 endpoint 設定。
需要特別注意的是,透過 HuggingFace 免費層使用時,高頻請求會觸發速率限制(rate limit),不適合正式產品場景;若要穩定呼叫,建議改用 ZAI 官方的 Developer API,同時享有更低延遲與更穩定的服務品質。
關鍵時刻
Pipeline v2帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。
事實查核
Pipeline v2說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。


