锐意创新 · 敏锐洞察 · 锐不可当

Sakana Fugu发布:当AI不再亲自答题,而是成为“超级指挥家”

在大模型纷纷追求“参数规模”的时代,日本AI独角兽Sakana AI扔下了一颗重磅炸弹。2026年6月22日,这家公司发布了名为Sakana Fugu(河豚)的系列编排器模型,包括Fugu Ultra和Fugu两款产品。与传统大模型不同,Fugu从不试图亲自回答问题,它更像一个精通“指挥术”的大脑,专门负责调度GPT、Claude、Gemini等世界上最顶尖的模型来完成任务。这种“不做超级大脑,只做超级指挥”的思路,让Fugu在工程、科学和推理基准测试中,性能迅速逼近甚至超越了Fable 5和Mythos Preview等头部选手。

Fugu的核心逻辑在于“集体智能”。面对一个复杂问题,Fugu会启动四大机制:识别问题类型、选择最擅长的Worker模型、设计多步骤的Agent工作流,以及根据反馈进行优化。比如遇到数学题,它可能调用擅长逻辑推理的模型;遇到代码编写,它则会委派给工程能力最强的模型。这种模式不仅打破了单一模型的能力边界,更被Sakana AI视为“AI主权的现实蓝图”——由于底层模型池完全可替换,用户不再受制于单一供应商,即便某家断供,也能迅速切换,彻底告别“卡脖子”风险。

在技术实现上,Fugu系列展现了极强的策略性。Fugu-Ultra主打质量优先,能将复杂任务拆解为多个子任务,安排不同Agent协同处理,最终综合出高质量答案;而Fugu则侧重性能与延迟的平衡,适合日常快速响应。两者都不需要访问Worker模型的权重,无论是开源还是闭源模型,新发布后都能直接加入调度池。这种与模型无关的完全模块化设计,让用户可以根据成本、隐私和合规需求,自由定制属于自己的“模型军团”。

为了验证实力,Sakana Fugu进行了一系列“魔鬼测试”。在“一次性魔方求解器”实验中,它成功编写出Python程序解开了全部300个乱序魔方;在“盲棋测试”里,它在看不见棋盘的情况下战胜了多个基线模型;甚至在经典的“洗车问题”(Strawberry中有几个r)这种容易让大模型翻车的陷阱题上,Fugu-Ultra也给出了正确答案。这些实验不仅证明了它处理长期策略和多步骤执行的能力,更展示了编排模型在逻辑严谨性上的巨大潜力。

本篇内容整理自网络,同步发布在 AEX新讯社中文网、希鸥网、斯贝瑞品牌资讯、RCEO创新网、AI联播网、创新日报 等媒体平台。如需删改或发布内容,请联系微信:meisceo29

阅读量:1177
阅读时间:3分钟