2026年的春节,比往年更「躁」,大厂们的AI暗战让年味里多了几分火药气。 关注商业科技圈就会发现,每逢佳节大厂的动作,本身就是一部鲜活的「行业进化史」,这次春节的AI之争更是如此。 11年前,2015年,微信支付硬是靠着春晚一场「红包雨」,对支付宝完成了一次「珍珠港偷袭」。那会儿拼的就是绑卡量,比谁能把用户的钱包牢牢留在线上。 11年后的今天,火药味又浓了,但战场早就换了模样。变在哪儿呢?核心是「入场券」的逻辑变了:从以前的支付,换成了现在的AI。 只不过核心诉求变了:以前抢红包是为绑银行卡,现在撒红包,只为让自家AI助手占稳用户手机首屏。 你看今年年底,腾讯玩得最猛,直接掏出10亿现金搞了个「AI派」,核心还是马化腾最拿手的那套:社交裂变。借着红包的由头,把「元宝」这个AI助手顺着微信、QQ的关系链,送到每一个大爷大妈、写字楼白领手里。 百度也没掉队,紧跟着甩出5亿红包,主打文心助手的「内容社交」,靠视频互动和口令,把红包和自家的搜索、内容生态绑得死死的。 两者本质都是互联网传统「流量逻辑」的延续,用福利换停留、靠现金堆日活。 但就在全网撒币、一片热闹的时候,阿里的打法却显得格外「另类」。它压根没打算在营销费上跟人硬刚,反而在1月26日凌晨,悄悄甩出了一个「超级大脑」:Qwen3-Max-Thinking。 没错。 这就像众人在集市吆喝发券,阿里却在后台默默升级小镇基建,它认准了:模型能力的代差,才是不可撼动的核心壁垒。 一组数据足以让行业冷静: Qwen3-Max-Thinking总参数量达1万亿(1T),预训练数据高达36T Tokens,在模型基座能力上实现「降维打击」。 更震撼的是「人类最后测试」(HLE)成绩:千问以58.3分远超GPT-5.2(45.5分)和Gemini 3 Pro(45.8分),在这个由海外模型主导的推理赛道上,首次出现国产模型的强劲身影。 不知道你有没有琢磨过,阿里为啥偏偏选在这个节骨眼上,死磕「推理能力」?答案很简单:大模型的下半场,拼「谁更会思考」。 阿里这次带了个挺新颖的技术,测试时扩展(Test-time Scaling)新机制。简单说,能从之前的推理结果里提炼经验,避免了看似增加思考、实则容易陷入重复思考死胡同的推理扩展通病。 这好比助理接到任务后,会先在脑中复盘查漏、优化细节,并结合上下文更智能地给出最优方案。这份能力也体现在硬指标上,GPQA Diamond、IMO-AnswerBench、LiveCodeBench均斩获全球第一。 这打法背后的逻辑,就是「以模代币」。 与其花10亿买领完就卸的「僵尸粉」,不如投进研发,做出媲美甚至超越GPT-5.2的模型,再将能力开放给所有用户。 现在QwenChat网页端、PC端都能免费试用,APP也快接入了。这策略特别「降维」: 等用户发现,用千问处理复杂任务、写代码、做深度研究,比别家更聪明、更流畅、出错更少,这种体验带来的用户留存,是5块钱红包永远换不来的。 而且,阿里的野心不止于此,Qwen3-Max-Thinking还强化了原生Agent能力,可自主调用工具,联动阿里生态实现点外卖、订机票等一站式服务,从「会说」升级为「会做」。 拆解完三家打法,2026年AI赛道的商业底色已然清晰: 腾讯、百度在卷「应用」,想靠着社交和内容稳住自己的流量江山;阿里在卷「道」,试图靠技术的极致进化,建起一道关于「推理权」的护城河。 这场红包战,本质是AI时代的「成人礼」,有人做抢占流量的钱包,有人做筑牢壁垒的大脑。你更看好哪一个?
2026年的春节,比往年更「躁」,大厂们的AI暗战让年味里多了几分火药气。 关
智远行业评论
2026-01-27 16:50:09
0
阅读:1