教程 05

教程 05 — 多模型與故障轉移:錢少也能用好 AI

目標:配置多個模型提供商,實現自動故障轉移,日常用便宜模型、複雜任務自動升級。


為什麼需要多模型?

場景 推薦模型
日常問答、翻譯 MiniMax M2.1(便宜)
複雜推理、代碼架構 Claude Opus 或 MiniMax M2.5(貴但強)
主力掛掉 / 限流 自動切換備用模型(不中斷使用)

場景一:MiniMax 主力 + Claude 備用

編輯 ~/.openclaw/openclaw.json

{
  "gateway": { "mode": "local" },
  "env": {
    "MINIMAX_API_KEY": "${MINIMAX_API_KEY}",
    "ANTHROPIC_API_KEY": "${ANTHROPIC_API_KEY}"
  },
  "agents": {
    "defaults": {
      "model": {
        "primary": "minimax/MiniMax-M2.1",
        "fallbacks": ["anthropic/claude-sonnet-4-6"]
      }
    }
  },
  "models": {
    "mode": "merge",
    "providers": {
      "minimax": {
        "baseUrl": "https://api.minimax.io/anthropic",
        "apiKey": "${MINIMAX_API_KEY}",
        "api": "anthropic-messages",
        "models": [
          {
            "id": "MiniMax-M2.1",
            "name": "MiniMax M2.1",
            "reasoning": false,
            "input": ["text"],
            "cost": { "input": 15, "output": 60, "cacheRead": 2, "cacheWrite": 10 },
            "contextWindow": 200000,
            "maxTokens": 8192
          }
        ]
      }
    }
  }
}

當 MiniMax 返回錯誤或超時,自動切換到 Claude Sonnet,使用者無感知。


場景二:不同任務用不同模型

在對話中手動切換模型:

# 切換到推理模型做複雜任務
pnpm openclaw models set minimax/MiniMax-M2.5
 
# 做完再切回便宜的
pnpm openclaw models set minimax/MiniMax-M2.1

或者通過斜線命令在對話中切換(如果啟用了模型切換 Skill):

/模型 M2.5
幫我設計一個分散式快取系統的架構

場景三:Claude Opus 主力 + MiniMax 備用(經濟模式)

{
  "agents": {
    "defaults": {
      "models": {
        "anthropic/claude-opus-4-6": { "alias": "opus" },
        "minimax/MiniMax-M2.1": { "alias": "minimax" }
      },
      "model": {
        "primary": "anthropic/claude-opus-4-6",
        "fallbacks": ["minimax/MiniMax-M2.1"]
      }
    }
  }
}

場景四:完整多模型配置(三重保障)

{
  "env": {
    "MINIMAX_API_KEY": "${MINIMAX_API_KEY}",
    "ANTHROPIC_API_KEY": "${ANTHROPIC_API_KEY}",
    "OPENAI_API_KEY": "${OPENAI_API_KEY}"
  },
  "agents": {
    "defaults": {
      "model": {
        "primary": "minimax/MiniMax-M2.1",
        "fallbacks": [
          "anthropic/claude-sonnet-4-6",
          "openai/gpt-4o"
        ]
      }
    }
  }
}

任意一個掛了,自動切到下一個,永不中斷。


查看當前使用的模型

在對話裡發:

/status

返回類似:

模型:minimax/MiniMax-M2.1
上下文:4,821 / 200,000 tokens
會話:main

查看 token 用量和費用

/usage

返回本次會話的 token 消耗和估算費用,幫助你控制成本。


思考等級(Thinking Level)

MiniMax M2.5 和 Claude Opus 支援「深度思考」模式,消耗更多 token 但回答更準確:

/think high
幫我分析這段代碼的時間複雜度並給出優化方案:
[貼上代碼]

思考等級:off / minimal / low / medium / high / xhigh

日常問答用 off,複雜任務用 high


模型選擇建議

任務類型 推薦模型 思考等級
日常問答 MiniMax M2.1 off
代碼生成 MiniMax M2.1 Lightning low
代碼審查 MiniMax M2.5 medium
系統設計 MiniMax M2.5 / Claude Opus high
數學推理 MiniMax M2.5 xhigh

常見問題

fallback(故障轉移)的觸發條件是什麼?

當主模型返回以下情況時自動觸發:HTTP 5xx 錯誤、請求超時、速率限制(429)、或模型服務不可用。OpenClaw 會按 fallbacks 陣列的順序依次嘗試,對使用者完全透明無感知。

如何知道當前實際在用哪個模型?

在對話中發 /status,返回的資訊中會顯示當前活躍模型的完整 ID(例如 minimax/MiniMax-M2.1)。如果發生了 fallback,日誌中會有記錄:tail -f /tmp/openclaw/openclaw-$(date +%Y-%m-%d).log | grep fallback

不同模型的 Token 費用怎麼計算?

費用按各模型提供商的官方價格計算,在 openclaw.jsonmodels[].cost 欄位中配置(單位:每百萬 token 的人民幣分)。執行 /usage 查看當前會話的 token 消耗和估算費用。

能在同一對話中手動強制切換模型嗎?

可以,使用 pnpm openclaw models set <模型ID> 命令即時切換,無需重啟網關。或者通過配置一個「模型切換」技能(SKILL.md),讓 AI 理解「切換到 M2.5」這樣的自然語言指令。

多個 Provider 的 API Key 都需要配置嗎?

只需要配置你實際要用到的 Provider。如果你配了 MiniMax 主力 + Claude 備用,那只需要這兩個 Key。沒有配置的 Provider 不會被調用,也不會報錯。


下一步

  • 教程 01 — 回顧基礎配置
  • 教程 03 — 寫一個「模型選擇」技能,讓 AI 自己決定用哪個模型

关注我们,获取最新 AI 动态

在 X 上关注 @lanmiaoai,第一时间获取教程更新、AI 工具推荐。

立即关注