Cascade 支持 Arena 模式,让你能够轻松比较不同模型对同一提示的回复。
| 模式 | 适用场景 |
|---|
| Single | 使用单个选定模型运行 Cascade |
| Arena | 比较不同模型的回复 |
要进入Arena 模式,请点击模型选择器中的 arena 按钮,然后选择你想使用的模型。
当你选择多个模型时,Cascade 会在不同的会话中分别使用每个模型独立执行你的提示。为实现隔离,每个模型还会拥有各自的 worktree。
如果你想同时查看两个对话,可以将
Cascade 选项卡拖到主编辑器窗口中,以获得更多可用空间。
你可以在每个 Cascade 对话中继续独立工作,包括接受或拒绝更改,或者提出后续问题。
由于每个模型都有自己的 worktree,你可以分别迭代每个响应,而不会影响其他会话。
当你准备好确定采用某种方案时,你应该点击“X is better”按钮,以舍弃其他对话,并让所有模型_汇聚_到你选择的方案上继续。
在汇聚后,你发送的下一条消息会发送给你已选择的所有模型,这样你就可以继续尝试不同的方案。
你无需手动选择模型,而是可以选择我们精选的模型组之一,让 Cascade 随机挑选两个模型进行比较。我们目前提供三个随机模型组:
- Frontier:包含 GPT 5.2、Claude Opus/Sonnet 4.5、Gemini 3 Pro 等前沿推理模型,侧重智能表现。
- Fast:包含 SWE 1.5、Claude Haiku、GPT-5.3-Codex-Spark 等快速推理模型,侧重速度表现。
- Hybrid:结合前沿模型和快速模型,兼顾速度与智能表现。
当你使用其中一个对战组时,在你点击“X is better”按钮让模型结果收敛之前,系统会隐藏具体的模型名称。之后,原始模型名称会显示出来,对话也会重新打乱顺序。
Arena 模式对每个模型收取的积分成本,与单独运行该模型时相同。这意味着,如果你选择一个 6x 模型和一个 4x 模型,则每次请求将收取 10 积分。
对于对战组,显示的积分成本是组内每个模型的成本。由于每个对战组会运行两个模型,因此每次请求的总积分成本是显示成本的两倍。
当你需要进行以下操作时,Arena 模式尤其有用:
- 比较不同模型的代码质量
- 探索解决复杂问题的不同思路
- 在不放弃默认偏好的情况下试用新模型
- 通过对战组以更低成本使用前沿模型
- Arena 模式仅支持已初始化 Git 仓库的工作区
- 默认情况下,只会将受 Git 跟踪的文件复制到为每个模型创建的 worktree 中;你可以根据需要配置一个设置钩子来复制其他文件
Worktrees
使用独立的 Git worktree 隔离并行进行的工作。