对比功能让您能够同时测试、比较并评估不同的 AI 模型、提示词、知识库或配置方案,帮助您快速找到最优组合,优化您的 AI 使用策略。
此功能目前处于α测试阶段,我们正在持续完善它。
核心特性
1. 对比多种配置,快速找到最佳方案
在同一个界面中并行对照模型、提示词、知识库、工具和附件等多种组合,直接看到不同方案的实际输出差异,避免反复切换和试错。
2. 同输入测试
开启“同步输入”后,输入一个prompt,验证不同模型的回答效果
3. 独立输入精细化评估,支持多场景实验
关闭“同步输入”后,每个对比面板可独立设定输入内容,帮助您模拟不同用户提问、不同上下文场景,从而更精准评估知识库和工具适用性。
4. 面向团队协作的可复用调优流
对比结果可总结、标注与沉淀,形成可共享的最佳实践配置,为团队快速建立统一、高质量的 AI 使用标准。
使用说明
1. 新建对比
在主界面点击「对比」按钮后,您可以创建新的对比页面。
操作:
- 每个面板均可独立选择模型(如 GPT-5 Instant、GPT-4.1 等)或agent

2. 同步输入测试
右上角可开启「同步输入」功能。
开启后,输入框中的问题会自动发送至所有已启用的对比面板。
示例:
输入:“请为我写一段新品发布的文案”
左侧使用 GPT-4.1,右侧使用 GPT-5
即可直接对比两者的创意表达差异。

3. 独立测试
您也可以在关闭「同步输入」的状态下,为每个面板单独输入问题或设置。
适合测试不同提示词或上下文时的效果差异。

4. 查看和分析结果
当模型输出完成后,您可以将结果导出为文档或分享,用于团队复盘或展示。


5. 退出对比模式
完成对比后可以选择退出对比模式、保留左侧对话、或者保留右侧对话

使用场景
| 场景 | 推荐模式 | 示例 |
|---|---|---|
| 不同模型在同一任务上的表现 | 同步输入 | “分别让 GPT-4.1 和 GPT-5 写同一个摘要” |
| 调优提示词、语气或风格细节 市场团队可以测试不同模型在语气、风格上的表现,选择更符合品牌调性的版本。 | 非同步输入 | “左侧写‘正式语气’,右侧写‘更活泼’” |
| 验证知识库效果是否一致 在同一知识库下对比不同模型的理解与回答准确率,帮助判断知识效果是否理想。 | 非同步输入 | 两侧加载同一知识库比对结果准确性 |
| 测试不同业务场景 / 业务术语模型适配度 | 非同步输入 | 每个面板输入不同的业务语境示例 |
使用技巧与注意事项
- 保持输入一致性:当测试不同模型时,建议保持相同的输入内容,以便准确评估模型差异。
- 逐步缩小范围:先进行宽泛对比,再聚焦到具体变量。