
文 | 字母AI
“我会漠视系数LLM公司,在搞明晰‘coding plan何如订价不亏钱’之前,不要盲目打价钱战。”近日,集团MiMo负责东说念主罗福莉在X平台发文,谈及针对脚下的Token订价问题发表办法。
让罗福莉下场发声的由头很浅薄:Anthropic在近期移动了家具计策,不再允许用Claude订阅运行OpenClaw。
本月4日起,Claude的Pro和Max订阅不再遮蔽OpenClaw等级三方框架,用户若是还要不竭使用这些智能体,只可改为通过API按量付费或购买罕见使用额度。
Claude官方证据称:这类调用对系统酿成了“远超预期的压力”。
而简直在统一时候,MiMo也推出了自家的Token Plan。
“Claude Code的订阅机制在计较资源分拨上瞎想得相等漂亮。但我觉得它并不收成以致可能失掉,除非API利润率逾越10到20倍。”在文中,罗福莉这么分析说念。
除了敕令不打价钱战,罗福莉的另一个中枢不雅点是:始终来看,Agent时期的模子正在招待一个“被动进化”的过程,优化高下文抑遏、复用已有计较收尾、减少无效token浮滥是接下来的迭代场合。
在她看来,Anthropic的这一步,正在推进通盘生态向这个场合:让高效的Agent和高效的模子协同进化。
不外,濒临Anthropic这一计策移动,也有东说念主汲取了不买账。
OpenClaw作家Peter Steinberger在X上平直开喷,他暗示,曾尝试与Anthropic疏浚,但最终只争取到一周的缓冲时候。

OpenClaw的巨大用户群体无疑是这一轮移动的最大受害者,好多用户订阅Claude,本来等于为了运行OpenClaw,而当今,这条旅途被平直割断。
当蓝本被觉得“腾贵价钱”的200好意思元的订阅,倏得间能跑出几千好意思元的算力浮滥,无疑是对厂商订价计策的一次考验。
另一方面,这并非是一句浅薄的“Token调用变多了”就能证据的局势。Agent正在重塑Token的调用逻辑,而背后这笔账,算起来还真有点复杂。
600倍浮动下,模子该何如订价
若是要用一个词来证据这场争议的中枢,那等于——波动,不可瞻望的波动。
南洋理工大学等团队在近期发布的筹商《Beyond Max Tokens》表露,在多轮器具调用的智能体场景中,统一个任务的计较浮滥,可能出现最高658倍的互异。
一条看起来近似的任务,有的几千个计较单位就杀青,有的则被拉到数万以致更高。这意味着,模子的资本不仅仅变得更高,而是不可瞻望。
“我仔细不雅察过OpenClaw的高下文抑遏——作念得不何如样。”

解构罗福莉在X上的发言,你能发现和南洋理工这份筹商的契合之处。罗福莉发现,在OpenClaw的一个用户恳求里,不时会发起多轮廉价值的器具调用,带来了巨大的模子调用量的蹂躏。
“确切资本很可能是订阅价钱的几十倍。这不是差距——这是一个‘深坑’。”
罗福莉所说“深坑”,问题出在OpenClaw这类智能体的运行形势:一个任务不时需要多轮尝试和回退,好多计较并不会平直产生收尾,但依然浮滥资源。
但这个浮滥资源的具体量级很难测算,这亦然Claude汲取封禁掉订阅接入Agent的渠说念,而不是汲取新建树一个“合理”订价的订阅套餐。
一言以蔽之,跟着Agent生态加快演变,Token用量的“合理”范围,根底无法准确预估。
“咱们一直在致力闲适不息增长的Claude需求,但咱们的订阅工作并非为这些第三方器具的使用模式而瞎想的。”谈及这一次业务移动,Claude Code负责东说念主Boris Cherny此前在X上这么写说念。
他暗示:“Token是一种咱们严慎抑遏的资源,咱们将优先辩论使用咱们家具和API的客户。”
关于这一移动带来的影响,有业内分析称之为“自助餐仍是杀青了”。OpenClaw开启了Agent的大帆海时期,但也推翻了此前的模子订价门槛。一个OpenClaw代理运行一天,就可能浮滥1000到5000好意思元的API资本。
“Anthropic正在承担每个通过第三方接口用户所产生的这部分差价,”增长营销巨匠Aakash Gupta在X上写说念。“这等于一家公司眼睁睁看着利润及时挥发的速率。”
资本填塞失控,这是Anthropic不得不坐窝作念出响应的原因。
在Chatbot口头里,订阅制之是以能延续,是因为不错凭证历史数据,统计出一个代表大部分用户的用量均值:轻度用户遮蔽重度用户,合座资本不错被摊平。
但在Agent场景中,这种结构被阻扰。重度使用不再是个例,而是由家具口头本人决定的收尾。唯独模子启动“实践任务”,就势必会出现长链路调用、高下文推广和重叠尝试。
近似的变化,其实仍是在其他家具中出现。此前当Cursor在移动订价时,就从“按恳求次数计费”转向“按现实Token资本折算的额度”,原因相同是长链路任务带来的资本互异,仍是无法用固定配额预计。
不外,用Token四肢惟一订价、实算实销的形势诚然看起来很科学,然则也带来了新的问题,Agent链路下Token用量不细目性依然存在,若是填塞用现实Token用量核算,十分于把这种不细目性转嫁给了用户。
因此,当Anthropic发表声光辉,用户不买账的声息也络绎接续。
X上有许多用户暗示,切换到API计费跑OpenClaw资本会严重攀升,使得他们不得不辩论其他道路。
汉典经被OpenAI“收编”的OpenClaw首创东说念主Steinberger,在X上“开喷”也带了一点叫板的意味。
有外媒分析,OpenAI似乎正在将我方定位为一个更“易于上手”的替代有策画,并可能期骗这一机会,从活气的Claude高档用户哪里获取客户。
著名媒体Axios此前在报说念中线路,曾有一位行业资深东说念主士暗示,“Anthropic强调磨真金不怕火和运行模子的着力,轮盘游戏app下载而OpenAI的心态是,CEO奥特曼总能筹集到更多资金来接济计较边界的扩展。”
这场争论的结局尚未可知,但毫无疑问的是,在2026年的AI边界,第三方自动化取得补贴、无穷计较智商的时期仍是杀青。
无论遴选哪种计费逻辑,更严慎、更细化的Token收费模式已在路上。
配额不是惟一出息,但已是脚下最优解
进一步盘考订价问题前,有必要先证据下咫尺模子家具的主流计费模式。
咫尺主流模子厂商大要形成“三层计费结构”。第一层是订阅制,面向个东说念主用户,如ChatGPT Plus、Claude Pro、Gemini Advanced,按月收费,提供更强模子与更高调用上限,但频繁奉陪速率与用量杀青。
第二层是API按量计费,以OpenAI、Anthropic、Google以及国内火山引擎、阿里云、智谱等公司,按token或等价计较量收费,是斥地者与企业的中枢结算形势。
在此之上,各家又推出Coding Plan/Token Plan等套餐,四肢订阅与按量之间的过渡口头:用户按月付费取得一定额度与优先权,但逾额仍需按量付费,并奉陪公说念使用与限流机制。
在Agent场景中,这一分层尤为关节,自动化调用大量只接济API按量计费,订阅与套餐难以遮蔽高强度、多轮调用的算力浮滥。而大部分“订阅模式”只针对一般用户的Chatbot和内嵌Agent功能。
跟着Anthropic针对Openclaw切换计费形势,其他厂商也接踵作念出响应,是更平直的——加价。
夙昔几周时候里,一轮团结调价出当今国内AI云厂商中。
腾讯云此前文告,自上月13日起杀青部分模子的免费公测,并转为庄重收费,同期对混元系列模子进行大幅调价,部分价钱涨幅高出400%。
随后,阿里和百度方面也发布公告,本月月中启动上调AI算力和存储价钱,合座涨幅在5%—30%区间。
而在几天前智谱的财报电话会议上,CEO张鹏线路,2026年一季度接口调用价钱普及了83%,但调用量仍然增长400%。
接连几家AI云厂商加价,证据了一件事:模子需求的增长来得太快,以致厂商的基建层齐倍感压力。
这小数在罗福莉的发文中也有体现:“更宏不雅地看:各人的算力供给,跟不上agent带来的token需求增长。”简直的出息,不是更低廉的token,而是模子和Agent的‘协同进化’。”
仅仅,在更高效的模子+Agent架构面世之前,加价或者杀青订阅,并不可处罚这套计费逻辑中的中枢矛盾。
从用户视角看,购买的是“任务完成”;但从模子厂商的视角,计量的是“计较过程”。
这两者之间,咫尺存在着彰着的错位。走订阅,厂商要承担Token调用不潜入的风险;走API,这个风险又来到了用户身上。
这亦然为什么“订阅+配额+API”的组合,同期出当今了各大厂商的落地有策画中。
在Harness/Coding场景下,千般plan本体上是一种用户与模子厂商之间的互相和解:厂商通过Coding/Token Plan套餐锁定一部分额度,换取用户侧的价钱细目性,同期用限流和国法限定风险。
但在OpenClaw这类更不受控的agent场景中,调用强度和旅途齐难以不息,这种“和解”很难建树,厂商们更多汲取 API按量计费。
订阅负责轻量使用,配额杀青顶点浮滥,逾额部分按量计费。本体上,这是一种对不细目性的缓冲机制。

不外,Token计价也并不是惟一的解法,行业内仍是在探索一些“另类”的模子收费模式。
一类是按任务收费。比如Anthropic在Claude Code中推出的Code Review功能,平直按一次PR审查计价,单次review平均资本在15–25好意思元,并随代码边界和复杂度浮动。
二是按收尾收费,仍是在企业侧落地,比如智能客服、RPA厂商按“问题处罚”或“历程完成”计价;还有一种是依时期收费,比如xAI的语音agent按运行时长计费,约0.05好意思元/分钟)。
几天前,在火山引擎武汉站巡展行为中,当字母AI问及“濒临模子调用激增、Token浮滥存在不细目性的近况,模子厂商该若何优化订价计策?”时,火山引擎总裁谭待这么回话:
“咫尺OpenClaw这类通用型平台合适按Token收费,因为其应用场景平方,无法调和界说成果和资本。”谭待同期暗示,未来可能会孵化出垂直边界的智能体,如客服智能体,就不错按回答问题的数目收费。“近似线下找客服的模式,按成果付费。”
“(Anthropic的这一步)大要率是一件功德。Agent时期不属于浮滥最多算力的东说念主,而属于最会使用算力的东说念主。”在那篇发文临了,罗福莉这么追思说念。
昭着,围绕Token收费的争论还将抓续下去,这一争论将取决于未来模子-Agent在着力层面的迭代情况。
咱们不错细目标是,夙昔一度被压到几厘钱每Token的单价,在这个调用量激增、链路无穷蔓延的Agent爆发周期,仍是变成了每一个用户齐无法忽视的资本要素。
Agent大帆海时期,Token收费这笔账,值得每一个厂商精良盘一盘。
凤凰体育(FHSports)官方网站
备案号: