# CCSwitch Ollama 本地模型接入 Codex 完整配置模板## 一、前置准备（必须完成）1. 升级 CCSwitch ≥ v3.13.02. 安装 Ollama，终端执行启动服务：```bash# Windows/macOS/Linux 通用ollama serve# 提前拉取代码专用模型示例ollama pull qwen2.5-coder:7bollama pull llama3.2-code:8bollama

# CCSwitch Ollama 本地模型接入 Codex 完整配置模板
## 一、前置准备（必须完成）
1. 升级 CCSwitch ≥ v3.13.0
2. 安装 Ollama，终端执行启动服务：
```bash
# Windows/macOS/Linux 通用
ollama serve
# 提前拉取代码专用模型示例
ollama pull qwen2.5-coder:7b
ollama pull llama3.2-code:8b
ollama pull deepseek-coder:6.7b
```
3. 确认 Ollama 正常访问：浏览器打开 `http://localhost:11434/v1/models`

## 二、CCSwitch 供应商完整填写模板（新建自定义供应商）
### 基础信息面板
| 配置项 | 填写值 | 说明 |
|--------|--------|------|
| 供应商名称 | Local-Ollama-Code | 自定义识别名，方便托盘切换 |
| API Base URL | `http://t.cn/AXVJqKD0` | Ollama OpenAI兼容接口固定地址 |
| API Key | `ollama-dummy-key` | Ollama不校验密钥，任意非空字符串即可 |
| 请求超时 | 120s | 本地大模型推理慢，延长超时防报错 |
| 代理通道 | 关闭 | 本地服务无需网络代理 |

### 高级参数面板（Codex专属）
1. 接口协议：OpenAI Chat Completion
2. 模型自动拉取：✅ 开启（点击「同步模型列表」自动读取本地所有Ollama模型）
3. 流式输出：✅ 开启（Codex代码实时返回）
4. 温度默认值：0.1（代码生成推荐低温度，减少随机）
5. Max Tokens：8192（适配7B/8B代码模型上下文）
6. 系统提示词（Codex专用）：
```
你是专业代码编程助手，只输出干净代码，精简注释，不冗余解释，修复代码错误、优化性能、生成完整可运行代码，支持各类编程语言。
```
7. 路由转发规则：✅ 开启Codex专用反向代理（核心，无需改Codex本地配置）

## 三、CCSwitch 绑定 Codex 应用步骤
1. 保存上方Ollama供应商配置
2. 左侧「应用绑定」→ 选中 `Codex CLI / Codex VSCode插件`
3. 默认服务商选择：`Local-Ollama-Code`
4. 默认模型自选（推荐代码模型）：
- qwen2.5-coder:7b（平衡速度与效果）
- deepseek-coder:6.7b-v2
- llama3.2-code:8b-instruct
5. 保存绑定，点击托盘图标→切换至Local-Ollama-Code配置

## 四、两种备用兜底方案（CCSwitch代理失效时）
### 方案1：Codex config.toml 本地配置模板（~/.codex/config.toml）
```toml
# 默认全局配置
model = "qwen2.5-coder:7b"
model_provider = "ollama-local"

# Ollama服务商定义
[model_providers.ollama-local]
name = "Local Ollama Code"
base_url = "http://localhost:11434/v1"
env_key = "OLLAMA_API_KEY"
timeout = 120

# 自定义推理参数
[model_params]
temperature = 0.1
max_tokens = 8192
top_p = 0.3
```
终端临时指定配置启动：
```bash
codex --provider ollama-local "写Python快速排序"
```

### 方案2：终端环境变量临时注入（Windows PowerShell / Mac zsh）
#### Windows PowerShell
```powershell
$env:CODEX_API_BASE="http://localhost:11434/v1"
$env:CODEX_API_KEY="dummy-ollama"
$env:CODEX_MODEL="qwen2.5-coder:7b"
codex
```
#### Mac/Linux
```bash
export CODEX_API_BASE=http://localhost:11434/v1
export CODEX_API_KEY=dummy-ollama
export CODEX_MODEL=qwen2.5-coder:7b
codex
```

## 五、连通性校验命令（排查失败）
### 1. 测试Ollama接口
```bash
curl http://localhost:11434/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "qwen2.5-coder:7b",
"messages": [{"role":"user","content":"输出Hello World Python代码"}]
}'
```
### 2. CCSwitch内置连通测试
打开CCSwitch供应商编辑页 → 点击「测试连通性」，返回模型列表即配置成功。
### 3. Codex内验证
```bash
# 查看当前生效模型
codex /model
# 测试代码生成
codex "写一个批量重命名文件的PowerShell脚本"
```

## 六、常见问题优化参数
1. 模型加载卡顿、超时：超时时间改为180s，关闭电脑后台占用内存软件
2. 代码输出截断：Max Tokens提升至16384（适合14B/34B模型）
3. 代码逻辑混乱：温度下调至0.05，top_p=0.2
4. 局域网其他设备访问Ollama：Ollama服务启动命令改为 `OLLAMA_HOST=0.0.0.0 ollama serve`，CCSwitch Base URL填 `http://设备IP:11434/v1`

## 七、多模型预设快速切换模板（CCSwitch多配置文件）
可复制多个供应商配置，分别命名：
- Local-Qwen7B-Code
- Local-DeepSeek6.7B
- Local-Llama3.2-8B
托盘菜单一键切换不同本地代码模型，无需修改参数。

发布于天津