Anthropic 新工具：Sonnet 遇到难题可以请教 Opus 了

罗皮发表于 7 天前

Anthropic 发布了一个新的 API 工具，让 Sonnet 或 Haiku 在跑任务的过程中，遇到搞不定的决策时自动请教 Opus，拿到指导后继续干活。这个策略叫 Advisor Strategy，工具叫 Advisor Tool

效果是：智能接近 Opus，成本接近 Sonnet

Advisor 策略的工作方式：Sonnet 执行，遇到难题请教 Opus

反过来的 Sub-Agent 模式行业里常见的多 Agent 模式是：大模型当指挥官，拆解任务分给小模型去执行。Advisor 策略把这个方向反过来了

Sonnet（或 Haiku）作为 Executor 全程执行任务，调用工具、读取结果、迭代推进。当它遇到一个自己判断力不够的决策点时，它会调用 Opus 作为 Advisor。Opus 拿到共享的上下文，返回一个计划、一个纠正、或者一个停止信号。然后 Sonnet 继续执行

Advisor 不调用工具，不产出面向用户的输出，只提供指导。前沿级推理只在 Executor 需要的时候介入，其余时间全部按 Executor 的价格计费

不是大模型指挥小模型干活，是小模型干活遇到难题请教大模型

这个设计的好处是：不需要任务拆解逻辑，不需要 worker pool，不需要编排框架。Executor 自己判断什么时候需要升级，整个过程在一次 API 调用里完成
评测数据先看 Sonnet + Opus Advisor 的组合

SWE-bench MultilingualSonnet + Advisor 比 Sonnet 单独跑提升了 2.7 个百分点，同时每个任务的成本降低了 11.9%。成本降低的原因是 Advisor 的介入让 Executor 少走弯路，减少了总 token 消耗

SWE-bench Multilingual：Sonnet + Advisor vs Sonnet Solo vs Opus Solo

BrowseComp 和 Terminal-Bench 2.0在 BrowseComp 和 Terminal-Bench 2.0 上，Sonnet + Advisor 同样超过了 Sonnet 单独跑，而且每个任务的成本更低

BrowseComp + Terminal-Bench：Sonnet + Advisor 的表现和成本

再看 Haiku + Opus Advisor 的组合，这个更有趣

在 BrowseComp 上，Haiku + Advisor 得分 41.2%，是 Haiku 单独跑（19.7%）的两倍多。跟 Sonnet 单独跑比，分数低了 29%，但成本低了 85%

BrowseComp：Haiku+Advisor vs Haiku Solo vs Sonnet Solo

对于高吞吐、需要平衡智能和成本的场景，这个组合很有吸引力。用Haiku的价格拿到接近Sonnet水平的结果

怎么用API层面非常简单。在Messages API请求的tools数组里加一个advisor_20260301类型的工具，指定Advisor模型是Opus，设一个max_uses限制每次请求最多请教几次

整个模型交接在一次/v1/messages请求里完成，不需要额外的网络来回，不需要自己管理上下文传递。Executor决定什么时候调用Advisor，Anthropic负责把精选的上下文路由给Advisor模型，拿到计划后Executor继续执行

计费方式：Advisor的token按Advisor模型的价格算（Opus的$5/$25），Executor的token按Executor模型的价格算（Sonnet的$3/$15或Haiku的$1/$5）。因为Advisor每次只生成一个短计划（通常400-700个token），整体成本远低于全程跑Opus

可以通过max_uses限制Advisor调用次数来控制成本。Advisor的token消耗在usage中单独报告

早期用户怎么说在复杂任务上做出了更好的架构决策，在简单任务上没有任何额外开销。计划和执行轨迹完全是两个级别

Eric Simmons，Bolt CEO

我们看到了Agent轮次、工具调用次数和整体分数的明确改善，比我们自己构建的planning工具效果更好

Kay Zhu，Genspark联合创始人兼CTO

在结构化文档提取任务上，Advisor让Haiku 4.5按需请教Opus 4.6，达到了前沿模型的质量，成本低5倍

Anuraj Pandey，Eve Legal机器学习工程师

页: [1]

豆瓜网's Archiver

Anthropic 新工具：Sonnet 遇到难题可以请教 Opus 了