# CCSwitch Ollama 本地模型接入 Codex 完整配置模板
## 一、前置准备(必须完成)
1. 升级 CCSwitch ≥ v3.13.0
2. 安装 Ollama,终端执行启动服务:
```bash
# Windows/macOS/Linux 通用
ollama serve
# 提前拉取代码专用模型示例
ollama pull qwen2.5-coder:7b
ollama pull llama3.2-code:8b
ollama pull deepseek-coder:6.7b
```
3. 确认 Ollama 正常访问:浏览器打开 `http://localhost:11434/v1/models`
## 二、CCSwitch 供应商完整填写模板(新建自定义供应商)
### 基础信息面板
| 配置项 | 填写值 | 说明 |
|--------|--------|------|
| 供应商名称 | Local-Ollama-Code | 自定义识别名,方便托盘切换 |
| API Base URL | `http://t.cn/AXVJqKD0` | Ollama OpenAI兼容接口固定地址 |
| API Key | `ollama-dummy-key` | Ollama不校验密钥,任意非空字符串即可 |
| 请求超时 | 120s | 本地大模型推理慢,延长超时防报错 |
| 代理通道 | 关闭 | 本地服务无需网络代理 |
### 高级参数面板(Codex专属)
1. 接口协议:OpenAI Chat Completion
2. 模型自动拉取:✅ 开启(点击「同步模型列表」自动读取本地所有Ollama模型)
3. 流式输出:✅ 开启(Codex代码实时返回)
4. 温度默认值:0.1(代码生成推荐低温度,减少随机)
5. Max Tokens:8192(适配7B/8B代码模型上下文)
6. 系统提示词(Codex专用):
```
你是专业代码编程助手,只输出干净代码,精简注释,不冗余解释,修复代码错误、优化性能、生成完整可运行代码,支持各类编程语言。
```
7. 路由转发规则:✅ 开启Codex专用反向代理(核心,无需改Codex本地配置)
## 三、CCSwitch 绑定 Codex 应用步骤
1. 保存上方Ollama供应商配置
2. 左侧「应用绑定」→ 选中 `Codex CLI / Codex VSCode插件`
3. 默认服务商选择:`Local-Ollama-Code`
4. 默认模型自选(推荐代码模型):
- qwen2.5-coder:7b(平衡速度与效果)
- deepseek-coder:6.7b-v2
- llama3.2-code:8b-instruct
5. 保存绑定,点击托盘图标→切换至Local-Ollama-Code配置
## 四、两种备用兜底方案(CCSwitch代理失效时)
### 方案1:Codex config.toml 本地配置模板(~/.codex/config.toml)
```toml
# 默认全局配置
model = "qwen2.5-coder:7b"
model_provider = "ollama-local"
# Ollama服务商定义
[model_providers.ollama-local]
name = "Local Ollama Code"
base_url = "http://localhost:11434/v1"
env_key = "OLLAMA_API_KEY"
timeout = 120
# 自定义推理参数
[model_params]
temperature = 0.1
max_tokens = 8192
top_p = 0.3
```
终端临时指定配置启动:
```bash
codex --provider ollama-local "写Python快速排序"
```
### 方案2:终端环境变量临时注入(Windows PowerShell / Mac zsh)
#### Windows PowerShell
```powershell
$env:CODEX_API_BASE="http://localhost:11434/v1"
$env:CODEX_API_KEY="dummy-ollama"
$env:CODEX_MODEL="qwen2.5-coder:7b"
codex
```
#### Mac/Linux
```bash
export CODEX_API_BASE=http://localhost:11434/v1
export CODEX_API_KEY=dummy-ollama
export CODEX_MODEL=qwen2.5-coder:7b
codex
```
## 五、连通性校验命令(排查失败)
### 1. 测试Ollama接口
```bash
curl http://localhost:11434/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "qwen2.5-coder:7b",
"messages": [{"role":"user","content":"输出Hello World Python代码"}]
}'
```
### 2. CCSwitch内置连通测试
打开CCSwitch供应商编辑页 → 点击「测试连通性」,返回模型列表即配置成功。
### 3. Codex内验证
```bash
# 查看当前生效模型
codex /model
# 测试代码生成
codex "写一个批量重命名文件的PowerShell脚本"
```
## 六、常见问题优化参数
1. 模型加载卡顿、超时:超时时间改为180s,关闭电脑后台占用内存软件
2. 代码输出截断:Max Tokens提升至16384(适合14B/34B模型)
3. 代码逻辑混乱:温度下调至0.05,top_p=0.2
4. 局域网其他设备访问Ollama:Ollama服务启动命令改为 `OLLAMA_HOST=0.0.0.0 ollama serve`,CCSwitch Base URL填 `http://设备IP:11434/v1`
## 七、多模型预设快速切换模板(CCSwitch多配置文件)
可复制多个供应商配置,分别命名:
- Local-Qwen7B-Code
- Local-DeepSeek6.7B
- Local-Llama3.2-8B
托盘菜单一键切换不同本地代码模型,无需修改参数。
发布于 天津
