近日,一场由普林斯顿大学发起的AI模拟公司运营大赛引发关注。在CEO-Bench测试中,14个AI模型被赋予100万美元本金,要求运营虚拟SaaS初创公司500天,目标是尽可能多盈利。结果令人意外:仅4个模型保住本金,其中3个实现正收益,而冠军Fable 5以4715万美元的成绩断层领先,展现了AI在复杂商业决策中的潜力。
希鸥网观察到,这场模拟赛堪称AI的“地狱级”挑战。模型需通过Python API调用34个工具和19张数据库表,自主决定定价、广告、研发、客服等策略,还要应对市场变化和竞争对手。由于成本即时消耗、回报延迟到来,模型必须独立应对不确定性,类似人类CEO的直觉决策。许多参赛AI因无法适应这种长程决策而破产,包括GLM 5.1和DeepSeek V4 Pro等知名模型。
Fable 5的胜利并非偶然。其成功秘诀在于“探索大于谨慎”——它积极尝试新策略,动态调整资源分配。相比之下,保守的Opus 4.7虽能苟活,却无法盈利。研究还发现,AI在发现隐藏信息、预测未来、适应变化和提前规划四个维度上的能力,与CEO表现高度相关。这为AI在商业领域的应用提供了关键参考。
一个有趣的插曲是,第四名竟是非语言模型的纯规则算法。这个基于固定定价和脚本的“阿甘”赚了1576万美元,超过多个大模型。这表明,当前大模型在复杂商业决策中未必优于简单策略。同时,论文指出,编程Agent框架(如Codex)并不适合CEO角色,反而限制了模型表现。垂直场景的深度适配,或许才是AI应用的新方向。
2026人工智能+实战应用及产业创新论坛将于7月31日在南京举办,欢迎全国各地人工智能创业者报名。本文内容整理自网络,将同步发布在希鸥网创投联盟网站(希鸥网、AI联播网、斯贝瑞品牌资讯、华商资讯网、金鸥财经、锐CEO网、AEXNEWS美讯社、创新日报)。欢迎媒体合作、会议咨询、纳斯达克大屏等业务对接~ 如需修改或发布文章,请加微信号:sheisceo