文章作者、来源:36氪 当模型能力逐渐趋同时,一家 AI 公司还能依靠什么建立长期价值? 过去,AI行业一直围绕一个问题竞争:谁拥有最聪明的模型。 模型参数、推理能力、Benchmark 排名,几乎构成了每一家 AI 公司发布会的全部内容。 无论是 OpenAI、Anthropic,还是智谱、MiniMax、月之暗面,文章作者、来源:36氪 当模型能力逐渐趋同时,一家 AI 公司还能依靠什么建立长期价值? 过去,AI行业一直围绕一个问题竞争:谁拥有最聪明的模型。 模型参数、推理能力、Benchmark 排名,几乎构成了每一家 AI 公司发布会的全部内容。 无论是 OpenAI、Anthropic,还是智谱、MiniMax、月之暗面,

MiniMax M3:一家AI公司,为什么开始重新定义自己的价值?

2026/07/05 16:31
阅读时长 11 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 crypto.news@mexc.com 联系我们。

文章作者、来源:36氪

当模型能力逐渐趋同时,一家 AI 公司还能依靠什么建立长期价值?

过去,AI行业一直围绕一个问题竞争:谁拥有最聪明的模型。

模型参数、推理能力、Benchmark 排名,几乎构成了每一家 AI 公司发布会的全部内容。

无论是 OpenAI、Anthropic,还是智谱、MiniMax、月之暗面,讲述自己的方式都高度一致。

模型越聪明,公司价值越高,这是第一代大模型公司的共同叙事。

现在,这种叙事开始出现变化。

比如MiniMax M3发布,最醒目的内容不再只是模型能力,而是 BrowserComp、SWE Bench、Terminal Bench、OSWorld、MCP Atlas。

这些名字有一个共同特点,它们讨论的,不再是模型知道什么。

而是模型能够完成什么。

很多人把这种变化理解成 Agent。

但如果把时间线拉长,会发现 M3 更值得关注的地方,并不是 Agent,而是 MiniMax 对自身价值的重新定义。

它开始尝试回答一个过去行业很少认真回答的问题:一家 AI 公司真正出售的,到底是什么?

01 第一代 AI 公司,出售的是 Intelligence

过去几年,竞争逻辑非常简单:模型能力,就是产品;Benchmark,就是价值。

MMLU,GSM8K,HumanEval,LiveCodeBench…

这些 Benchmark 的意义,从来不仅仅是技术测试,它们更像是一套市场共同认可的价值语言。

CPU 有 SPEC,GPU 有 MLPerf,数据库有 TPC。

每一个成熟产业都会形成自己的 Benchmark,因为市场需要一种统一标准,去理解产品价值、评估采购决策,也帮助资本形成共识。

因此,无论是参数规模,还是排行榜位置,都成为市场理解一家 AI 公司最直接的方式。

这一阶段,模型本身就是商品。

MiniMax M3,一个容易被忽略的变化: MiniMax 花了大量篇幅介绍另一类能力。

SWE Bench、BrowserComp、Terminal Bench、OSWorld、MCP,这些 Benchmark 有一个共同特点:它们几乎都不关心模型会不会回答问题。

它们关心的是:模型能不能修复真实 Bug,能不能独立完成网页操作,能不能调用开发环境,能不能连接企业系统,能不能完成一项完整工作。

换句话说,Benchmark 的评价对象开始发生变化。

过去评价的是 Intelligence,今天评价的是 Task Completion。

模型第一次开始接受"岗位考核",而不是"知识考试"。

这不仅仅是评测体系变化,它更像是 MiniMax 对市场释放的一种信号:

模型能力依然重要,但真正决定商业价值的,将是工作能力。

02 为什么 MiniMax 开始强调工作?

过去,大模型最重要的客户是开发者。开发者购买的是能力,他们关心模型是不是更聪明,是不是能够解决更复杂的问题。

但企业不同,企业采购 AI,很少关心模型在排行榜上排第几。

企业真正关心的是:它能够帮助业务完成多少工作?减少多少人工?进入多少流程?提升多少效率?

于是,产品表达也开始发生变化。

Browser,不再只是浏览器能力,而是进入办公流程;Coding,不只是代码生成,而是进入研发流程;Terminal,不只是 Linux,而是进入开发环境;MCP,也不只是协议,而是进入企业已有的软件系统。

如果把这些能力放在一起看,就会发现 MiniMax 想展示的,不是一个模型,而是一套工作流能力。

03 从Token,到Workflow

很多人仍然把 AI 公司理解为 API 公司,收入来自 Token。

调用次数越多,收入越高,这是第一代 AI 商业模式。

但今天,一个新的趋势正在出现。

越来越多企业购买 AI,并不是为了获得更多回答,而是为了完成更多工作。

修一个 Bug、整理一次会议、处理一张工单、分析一份合同、完成一次网页操作,价值单位开始发生变化。

过去,一次调用对应一个 Answer,今天,一次调用越来越对应一项 Task。

MiniMax M3 的产品设计,也越来越围绕这一逻辑展开。

模型成为底座,Workflow 成为产品。

如果把 M3 放到整个行业里看,会发现它代表的是一种新的产品叙事。

越来越多 AI 公司开始证明:工作能力。

这种变化,并不仅仅发生在 MiniMax。

Claude Code 强调的是开发工作流;OpenAI 的 Operator、Computer Use 关注的是任务执行;Google 不断强化 Gemini 在 Workspace 和浏览器中的协同能力。

行业正在围绕一个新的竞争单位展开:Workflow 和 Productivity。

04 为什么这种变化值得资本关注?

资本市场真正关心的,从来不是技术领先本身,而是技术如何转化为持续收入。

模型能力能够建立技术壁垒。

但 Workflow 更容易建立商业壁垒。

因为工作流一旦进入企业,就意味着:数据沉淀、流程绑定、员工习惯、系统集成。

这些都意味着更高的续费率、更高的客户黏性,以及更稳定的商业模式。

因此,越来越多 AI 公司开始把产品叙事,从模型能力转向工作能力。

这并不是放弃模型,而是在寻找模型之外,更长期的价值来源。

把视角再拉高一点,会发现 M3 最值得关注的地方,并不是某一项 Benchmark。

而是 MiniMax 对未来竞争对象的重新定义:从另一家模型公司到企业工作入口、浏览器、IDE、Office、ERP、CRM。

企业的数据不会沉淀在一次聊天中,它最终沉淀在每天发生的工作流里。

谁能够进入更多工作流,谁就拥有更强的商业基础。

从这个意义上看,MiniMax 未来面对的,不只是 OpenAI 或 Anthropic。

更是所有定义企业工作方式的软件平台。

尾声:一家 AI 公司价值重构的开始

如果说过去的大模型竞争,是围绕 Intelligence 展开,那么今天,MiniMax M3 展示的是另一种竞争逻辑。

模型依然重要。

但模型正在从产品,变成基础设施。

真正站到台前的,是模型如何进入企业、连接软件、完成工作。

对于 MiniMax 来说,这或许比一次 Benchmark 排名更加重要。

因为它意味着,公司开始尝试回答一个新的问题:

当模型能力逐渐趋同时,一家 AI 公司还能依靠什么建立长期价值?

M3 给出的答案,不是更多参数,也不是更多排行榜,而是更多真实工作。

这或许也是 AI 行业进入下一阶段最重要的信号。

未来,决定一家 AI 公司价值的,不只是模型有多聪明,而是它能够帮助企业重新组织多少生产力。

市场机遇
Gensyn 图标
Gensyn实时价格 (AI)
$0.02862
$0.02862$0.02862
+3.54%
USD
Gensyn (AI) 实时价格图表

世界杯预测,一单串多场,搏200倍收益!

世界杯预测,一单串多场,搏200倍收益!世界杯预测,一单串多场,搏200倍收益!

MEXC App 6.60.0 全新升级,巴西/法国/阿根廷等最多20场组合,一键轻松下注!

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 crypto.news@mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

$5,000,000 SPCX 合约仓位免费送!

$5,000,000 SPCX 合约仓位免费送!$5,000,000 SPCX 合约仓位免费送!

0 手续费| 100x杠杆 | 每日奖励,更有7000+ 股票/ETF任你选择!