100%免费！Claude Code 跑本地模型，无需 API！免翻墙使用超强AI Agent｜Ollama｜CC Switch｜零度解说

零度解说·5月15日週五·15 min中文

三句話摘要

透過 CC Switch 與 Ollama，將本地 AI 模型偽裝成 Claude API，免費離線驅動 Claude Code 桌面版 Agent。 CC Switch + Ollama 讓任何人都能用本地開源模型零成本驅動 Claude Code Agent，模型規模是決定任務品質的唯一瓶頸。 Claude Code 是 AI Agent，不只是聊天工具：它能讀取整個程式碼庫、分析依賴關係、自動修改檔案、執行終端指令，本質上是 AI + IDE + Terminal + 檔案系統的整合，上下文視窗遠超 Cursor。

重點整理

重點

1
Claude Code 是 AI Agent，不只是聊天工具：它能讀取整個程式碼庫、分析依賴關係、自動修改檔案、執行終端指令，本質上是 AI + IDE + Terminal + 檔案系統的整合，上下文視窗遠超 Cursor。
2
CC Switch 的核心是「請求代理偽裝」：Claude Code 發出的 API 請求被 CC Switch 在本地攔截，透過 OpenAI 相容模式轉發給 Ollama，模型永遠不知道自己不是 Claude——甚至會自稱「我是 Claude Haiku/Opus」。
3
模型選擇直接影響輸出品質：測試中 Gemma 4 26B 生成的 3D 跑酷遊戲功能完整，而 Qwen 3.5 9B（6.6GB）因模型較小，輸出存在明顯缺陷，顯示本地模型的規模與顯存直接決定 Agent 任務的完成品質。
4
配置流程需要 Windows 虛擬化支援：部署過程需開啟 Windows 子系統（WSL）、虛擬機器平台等功能，並透過匯出注冊表檔案將網關地址注入 Claude Code，屬一次性設定。

實用技巧與重點

乾貨

工具清單：Claude Code 桌面版（6MB）、CC Switch（11MB）、Ollama（190MB）、Git
Ollama 版本：0.2.4.0
模型選項與大小：
Gemma 4 26B：約 17GB，需 24GB 顯存
Gemma 4 系列：7G / 9G / 9.6G / 18G / 20G / 7.2G 量化版
Qwen 3.5 9B：6.6GB，適合 8GB 顯存
Qwen 3.5 系列：1G / 4G / 5G / 9G 多種尺寸
Ollama 本地 API 地址：`127.0.0.1:11434/v1`
API 格式：OpenAI 相容模式
API KEY：本地模型可隨意填寫（如 `123456`）
需開啟的 Windows 功能：Windows Hypervisor Platform、適用於 Linux 的 Windows 子系統、虛擬機器平台
查詢已安裝模型指令：`ollama list`
模型切換：在 CC Switch 編輯供應商設定，替換模型名稱即可，其餘配置不變
測試任務一：生成賽博龐克個人網站（動態背景、毛玻璃、打字機動畫、音樂播放器、粒子特效、響應式布局）
測試任務二：製作 3D 跑酷遊戲

結論

“CC Switch + Ollama 讓任何人都能用本地開源模型零成本驅動 Claude Code Agent，模型規模是決定任務品質的唯一瓶頸。”

完整解析

詳細

近期 AI 圈出現一種無需付費、完全離線的 Claude Code 使用方式：透過開源工具 CC Switch，將本地 AI 模型偽裝成 Claude 官方 API，直接驅動 Claude Code 桌面版執行複雜的 AI Agent 任務。這個玩法的前提是理解 Claude Code 本身的定位——它不是聊天工具，而是能夠讀取整個專案代碼庫、分析依賴關係、自動修改檔案、安裝套件並執行終端指令的完整 AI Agent，一條自然語言指令即可觸發一系列自動化工程操作，能力遠超 Cursor 等工具。

整套部署分三個環節。第一步安裝 Claude Code 官方桌面版（約 6MB Windows 安裝包）。第二步安裝 CC Switch，這是本次的核心工具，負責攔截 Claude Code 對 Anthropic API 的請求並轉發給本地模型；設定時需建立自訂供應商，填入 Ollama 的本地地址 `127.0.0.1:11434/v1`，API 格式選 OpenAI 相容模式，API Key 可隨意填寫，最後啟用路由轉發功能。第三步安裝 Ollama 並拉取所需模型，指令格式為 `ollama pull <model_name>`；模型選擇依顯存決定，8GB 顯存建議選 Qwen 3.5 9B（6.6GB），24GB 顯存可執行 Gemma 4 26B（17GB）。

完成三個工具的安裝後，需額外開啟 Windows 虛擬化相關功能（Hypervisor Platform、WSL、虛擬機器平台），重啟電腦後進入 Claude Code 開發者模式，填入 CC Switch 提供的本地網關地址與 API Key，並匯出注冊表檔案注入模型選項設定。設定完成後，Claude Code 啟動時會看到三個「模型」選項，實際上全部指向本地 Ollama 模型，Claude Code 完全察覺不到差異——當被問及底層模型時，它會自稱「我是 Claude Haiku」或「我是 Claude Opus」。

實測結果顯示，Gemma 4 26B 在生成賽博龐克風格個人網站（含粒子特效、毛玻璃、打字機動畫）與 3D 跑酷遊戲時，功能完整性與執行效果均表現正常，GPU 佔用接近 100%；而 Qwen 3.5 9B 因模型規模較小，生成的遊戲邏輯存在明顯缺陷。整套流程一旦設定完成，後續切換模型只需在 CC Switch 中更改模型名稱並儲存即可，無需重新配置。

關鍵時刻

Pipeline v2

帶時間戳的重點，會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。

事實查核

Pipeline v2

說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。

100%免费！Claude Code 跑本地模型，无需 API！免翻墙使用超强AI Agent｜Ollama｜CC Switch｜零度解说

三句話摘要

重點整理

實用技巧與重點

結論

完整解析

關鍵時刻

事實查核

更多「AI 技術」的內容

Claude Cowork vs Codex: 誰才是更好的AI工作助手？

我贏得 NVIDIA GTC Taipei 2026 的金票啦！這 4 天展期會有什麼不一樣的體驗呢？ | Computex 2026

黃仁勳親自欽點⁉️執笠手機公司 BlackBerry 變身 AI 機械人主系統🤖下一個大浪提前準備