100%免费!Claude Code 跑本地模型,无需 API!免翻墙使用超强AI Agent|Ollama|CC Switch|零度解说
三句話摘要
透過 CC Switch 與 Ollama,將本地 AI 模型偽裝成 Claude API,免費離線驅動 Claude Code 桌面版 Agent。 CC Switch + Ollama 讓任何人都能用本地開源模型零成本驅動 Claude Code Agent,模型規模是決定任務品質的唯一瓶頸。 Claude Code 是 AI Agent,不只是聊天工具:它能讀取整個程式碼庫、分析依賴關係、自動修改檔案、執行終端指令,本質上是 AI + IDE + Terminal + 檔案系統的整合,上下文視窗遠超 Cursor。
重點整理
重點- 1
Claude Code 是 AI Agent,不只是聊天工具:它能讀取整個程式碼庫、分析依賴關係、自動修改檔案、執行終端指令,本質上是 AI + IDE + Terminal + 檔案系統的整合,上下文視窗遠超 Cursor。
- 2
CC Switch 的核心是「請求代理偽裝」:Claude Code 發出的 API 請求被 CC Switch 在本地攔截,透過 OpenAI 相容模式轉發給 Ollama,模型永遠不知道自己不是 Claude——甚至會自稱「我是 Claude Haiku/Opus」。
- 3
模型選擇直接影響輸出品質:測試中 Gemma 4 26B 生成的 3D 跑酷遊戲功能完整,而 Qwen 3.5 9B(6.6GB)因模型較小,輸出存在明顯缺陷,顯示本地模型的規模與顯存直接決定 Agent 任務的完成品質。
- 4
配置流程需要 Windows 虛擬化支援:部署過程需開啟 Windows 子系統(WSL)、虛擬機器平台等功能,並透過匯出注冊表檔案將網關地址注入 Claude Code,屬一次性設定。
實用技巧與重點
乾貨- 工具清單:Claude Code 桌面版(6MB)、CC Switch(11MB)、Ollama(190MB)、Git
- Ollama 版本:0.2.4.0
- 模型選項與大小:
- Gemma 4 26B:約 17GB,需 24GB 顯存
- Gemma 4 系列:7G / 9G / 9.6G / 18G / 20G / 7.2G 量化版
- Qwen 3.5 9B:6.6GB,適合 8GB 顯存
- Qwen 3.5 系列:1G / 4G / 5G / 9G 多種尺寸
- Ollama 本地 API 地址:`127.0.0.1:11434/v1`
- API 格式:OpenAI 相容模式
- API KEY:本地模型可隨意填寫(如 `123456`)
- 需開啟的 Windows 功能:Windows Hypervisor Platform、適用於 Linux 的 Windows 子系統、虛擬機器平台
- 查詢已安裝模型指令:`ollama list`
- 模型切換:在 CC Switch 編輯供應商設定,替換模型名稱即可,其餘配置不變
- 測試任務一:生成賽博龐克個人網站(動態背景、毛玻璃、打字機動畫、音樂播放器、粒子特效、響應式布局)
- 測試任務二:製作 3D 跑酷遊戲
結論
結論“CC Switch + Ollama 讓任何人都能用本地開源模型零成本驅動 Claude Code Agent,模型規模是決定任務品質的唯一瓶頸。”
完整解析
詳細近期 AI 圈出現一種無需付費、完全離線的 Claude Code 使用方式:透過開源工具 CC Switch,將本地 AI 模型偽裝成 Claude 官方 API,直接驅動 Claude Code 桌面版執行複雜的 AI Agent 任務。這個玩法的前提是理解 Claude Code 本身的定位——它不是聊天工具,而是能夠讀取整個專案代碼庫、分析依賴關係、自動修改檔案、安裝套件並執行終端指令的完整 AI Agent,一條自然語言指令即可觸發一系列自動化工程操作,能力遠超 Cursor 等工具。
整套部署分三個環節。第一步安裝 Claude Code 官方桌面版(約 6MB Windows 安裝包)。第二步安裝 CC Switch,這是本次的核心工具,負責攔截 Claude Code 對 Anthropic API 的請求並轉發給本地模型;設定時需建立自訂供應商,填入 Ollama 的本地地址 `127.0.0.1:11434/v1`,API 格式選 OpenAI 相容模式,API Key 可隨意填寫,最後啟用路由轉發功能。第三步安裝 Ollama 並拉取所需模型,指令格式為 `ollama pull <model_name>`;模型選擇依顯存決定,8GB 顯存建議選 Qwen 3.5 9B(6.6GB),24GB 顯存可執行 Gemma 4 26B(17GB)。
完成三個工具的安裝後,需額外開啟 Windows 虛擬化相關功能(Hypervisor Platform、WSL、虛擬機器平台),重啟電腦後進入 Claude Code 開發者模式,填入 CC Switch 提供的本地網關地址與 API Key,並匯出注冊表檔案注入模型選項設定。設定完成後,Claude Code 啟動時會看到三個「模型」選項,實際上全部指向本地 Ollama 模型,Claude Code 完全察覺不到差異——當被問及底層模型時,它會自稱「我是 Claude Haiku」或「我是 Claude Opus」。
實測結果顯示,Gemma 4 26B 在生成賽博龐克風格個人網站(含粒子特效、毛玻璃、打字機動畫)與 3D 跑酷遊戲時,功能完整性與執行效果均表現正常,GPU 佔用接近 100%;而 Qwen 3.5 9B 因模型規模較小,生成的遊戲邏輯存在明顯缺陷。整套流程一旦設定完成,後續切換模型只需在 CC Switch 中更改模型名稱並儲存即可,無需重新配置。
關鍵時刻
Pipeline v2帶時間戳的重點,會在逐字稿層級分析上線後產生。目前請先透過原始影片觀看。
事實查核
Pipeline v2說法查證是下一次管線升級的一部分。KeyFrame 只會顯示它真正能驗證的內容。


