轮盘APP 百度AI最新推崇,李彦宏打出一张规章牌

发布日期:2026-05-12 12:19    点击次数:158

轮盘APP 百度AI最新推崇,李彦宏打出一张规章牌

在算力贵过黄金的时间,规章本人即是壁垒。

新眸原创 · 作家 | 李小东

百度选在 2026 年 Create 大会开幕前四天,端出了文心大模子 5.1。

这个期间点的选拔不算就怕。5 月 13 日的征战者大会需要一张技巧底牌,而距离上一个版块发布已往常近半年,市集上对于“百度大模子掉队”的声息正在变响。

这个时候推出的文心 5.1,需要用数据走动击这些质疑,而它也果然拿出了几张够硬的牌:搜索榜国内第一,预历练资本仅为业界同范畴模子的 6%,Agent 才能越过 DeepSeek-V4-Pro。

但回看百渡往常一年的 AI 轨迹,一个问题很难逃匿:技巧上的最初,似乎并没全皆滚动为市集端的最初?文心 5.1 给出的谜底,重量又有多重呢?

三组数据

妥协一桩“旧案”

先看文心 5.1 到底亮出了什么。

左证 LMArena 大模子竞技场最新排行,文心 5.1 以 1223 分位列搜索榜国内第一、全球第四,是该榜单中独一上榜的国产大模子。它的 Preview 版块早在 4 月 30 日就以 1476 分登顶文本榜国内第一,越过 GPT-5.5 和 DeepSeek-V4-Pro,是前十五名中独一入围的国产模子。

对于一家从 2023 年起就被反复质疑“大模子没声息了”的公司来说,这两项收获是某种意旨上的“解案”,至少从榜单维度看,百度的模子才能莫得掉队。

不外值得接洽的,果然不是分数,而是分数背后的技巧旅途选拔。

文心 5.1 的中枢技巧叫“多维弹性预历练”。这个提法最早在文心 5.0 发布时出现,它的逻辑是:在一次预历练经由中,通过动态采样机制同期优化大批不同深度、众人容量和寥落度的子模子,最终构建一个粉饰不同参数范畴和研究预算的子模子矩阵。

翻译成口语即是,一次历练,生成多种型号,不再需要为每种范畴单独烧一次算力。按照研发东谈主员的表述,这套框架区分沿弹性深度、弹性众人容量和弹性寥落度三个维度作念压缩与扩张,通过可变 Top-k 路由天真调配激活众人数目,在推理支出和模子性能之间建筑可控的鼎新空间。

落到具体数字上:文心 5.1 的总参数被压缩到文心 5.0 的约三分之一,激活参数压缩到约二分之一,预历练研究资本仅为同范畴同类模子的 6%。

6% 这个数字很容易被误读。它不是说“用 6% 的钱作念出了 100% 的性能”,而是说,在同等参数目级和性能水平下,历练阶段挥霍的算力只用了行业惯常的 6%。这是通过“模子压缩和弹性历练大幅镌汰冗余研究”来竣事的,是一种预历练要领的规章提高。

在 2026 年全球数据中心能耗争议抓续升级、国产芯片供给尚不弥漫的配景下,轮盘APP这个标的的选拔,劝服力不弱。

再看评测数据。在 τ -bench 和 SpreadsheetBench-Verified 两项智能体评测任务中,文心 5.1 越过了 DeepSeek-V4-Pro,官方给出的样貌是“智能体才能已接近最初闭源模子的水平”。创意写稿方面则与 Gemini 3.1 Pro 抓平,在 AIME26 数学竞赛(使用器具)上拿到 99.6 分,仅次于 Gemini 3.1 Pro。

这些数据大多是百度里面评测或较小的基准测试,并不是 LMArena 那种大范畴盲测榜单,肃肃性还需更多第三方考据,但全体标的是明晰的:这代模子的升级空间主要在 Agent 和深度搜索才能上,而非隧谈的言语抒发。

当今,文心 5.1 已在千帆模子广场和文心一言官网上线,征战者不错通过千帆平台调用 API。百度还书记将文心 5.1 连续接入 ISEKAI ZERO、Mulan AI、谛听幻流、Storymaster 等高出十个创意分娩智能体平台。

这个四肢的意图彰着,不是只谈模子,而是谈模子落地。

放在整个这个词行业,文心 5.1 在产物端的节拍不算慢。但真实让百度头疼的,一直皆不是技巧。

百度选了一条不同的路

要是单纯比打分,文心 5.1 并不舛错。但 2026 年的 AI 市集,尤其在中国,产物竞争,比拟看分数,大家更在乎的是谁的用户多、场景多。

2026 年春节,四家大厂在 AI 领域的总营销参加接近 50 亿元。百度抢先开局,拿出 5 亿现款红包,把进口沿路放在百度 App 生态内。字节豆包参加 15 亿到 20 亿,腾讯元宝 10 亿,阿里千问脱手最重,60 亿。

左证 QuestMobile 的数据,春节前后字节豆包以 8400 万日活开局,除夜今日冲到 1.45 亿峰值;阿里千问行为次日日活达到 7352 万;腾讯元宝除夜 4054 万。而百度文心的用户增长弧线动静平平。

外界感知到的是,百度在 C 端用户的争夺中正在被甩开,诚然模子才能不竭迭代,但公众感知严重滞后。这是中国 AI 产业一个稀奇的悖论,技巧团队不竭优化历练规章,但用户只怜惜“这玩意儿能不成帮我订机票”。两个坐标系相互不刚烈。

要是要说一个更大的行业叙事,2026 年上半年的要道词轮盘APP,正在从“武备竞赛”切换到“生意化”。

安博app(中国)官方网站