对比

阅读时间 1 分钟

对比功能让您能够同时测试、比较并评估不同的 AI 模型、提示词、知识库或配置方案,帮助您快速找到最优组合,优化您的 AI 使用策略。

此功能目前处于α测试阶段,我们正在持续完善它。

核心特性

1. 对比多种配置,快速找到最佳方案

在同一个界面中并行对照模型、提示词、知识库、工具和附件等多种组合,直接看到不同方案的实际输出差异,避免反复切换和试错。

2. 同输入测试

开启“同步输入”后,输入一个prompt,验证不同模型的回答效果

3. 独立输入精细化评估,支持多场景实验

关闭“同步输入”后,每个对比面板可独立设定输入内容,帮助您模拟不同用户提问、不同上下文场景,从而更精准评估知识库和工具适用性。

4. 面向团队协作的可复用调优流

对比结果可总结、标注与沉淀,形成可共享的最佳实践配置,为团队快速建立统一、高质量的 AI 使用标准。

使用说明

1. 新建对比

在主界面点击「对比」按钮后,您可以创建新的对比页面。

操作:

  • 每个面板均可独立选择模型(如 GPT-5 Instant、GPT-4.1 等)或agent

2. 同步输入测试

右上角可开启「同步输入」功能。

开启后,输入框中的问题会自动发送至所有已启用的对比面板。

示例:

输入:“请为我写一段新品发布的文案”

左侧使用 GPT-4.1,右侧使用 GPT-5

即可直接对比两者的创意表达差异。

3. 独立测试

您也可以在关闭「同步输入」的状态下,为每个面板单独输入问题或设置。

适合测试不同提示词或上下文时的效果差异。

4. 查看和分析结果

当模型输出完成后,您可以将结果导出为文档或分享,用于团队复盘或展示。

5. 退出对比模式

完成对比后可以选择退出对比模式、保留左侧对话、或者保留右侧对话

使用场景

场景推荐模式示例
不同模型在同一任务上的表现同步输入“分别让 GPT-4.1 和 GPT-5 写同一个摘要”
调优提示词、语气或风格细节 市场团队可以测试不同模型在语气、风格上的表现,选择更符合品牌调性的版本。非同步输入“左侧写‘正式语气’,右侧写‘更活泼’”
验证知识库效果是否一致 在同一知识库下对比不同模型的理解与回答准确率,帮助判断知识效果是否理想。非同步输入两侧加载同一知识库比对结果准确性
测试不同业务场景 / 业务术语模型适配度非同步输入每个面板输入不同的业务语境示例

使用技巧与注意事项

  • 保持输入一致性:当测试不同模型时,建议保持相同的输入内容,以便准确评估模型差异。
  • 逐步缩小范围:先进行宽泛对比,再聚焦到具体变量。
这篇文章解决了你的问题吗?