行业资讯
发布日期:2026-06-23 15:26 点击次数:159

DeepSeek那次让硅谷失眠,这一次,中国模子让硅谷列队点赞

DeepSeek那次让硅谷失眠,这一次,中国模子让硅谷列队点赞

出品 | 网易智能

作者 | 辰辰

裁剪 | 王凤枝

硅谷技巧圈在列队夸一个中国AI模子。

GLM 5.2发布后的48小时内,fast.ai独创东说念主、Vercel CEO、前DeepMind高管,这群东说念主以前不精真金不怕火夸敌手,更不会夸中国模子,在X上排着队说它好。

莫得PR安排。莫得\"但咱们也有上风\"。等于好用,是以说了。

上一次硅谷被中国模子震到,是DeepSeek R1。那次的中枢词是低廉。这一次不是低廉,是够用。

成本市集也在讲合并个故事。6月22日,智谱港股盘中冲破1万亿港元,涨近20%。DeepSeek那次让纳斯达克一天挥发了1万亿好意思元。这一次,智谱我方的市值在港股盘中冲破了1万亿港元。

一、列队点赞的东说念主

先看列队的东说念主都有谁。

马特·维罗索(Mat Velloso),先后在Meta、DeepMind和微软担任过高管,见过统统顶级模子。他在X上写了一句话:

\"用了一整天GLM 5.2。没认为缺什么。第一个能当日常用车(daily driver)的开源模子。事情不会一样了。\"

\"日常用车\"在技巧圈有精准含义。 不是展台上的见解车,不是纽博格林赛说念上的圈速王,是你每天上班、接送孩子、跑高速都不需要想第二下的那辆车。维罗索说一个中国开源模子达到了这个圭表。这是他业绩生存里第一次这样说。

然后是吉列尔莫·劳赫(Guillermo Rauch),Vercel的CEO,旗下一家工作数百万诞生者的云平台公司。他写的是:

\"忠心佩服,简直不错说是颤抖。GLM-5.2的编程才略太强了。这会改变花样。\"

翔实措辞。不是\"成心旨兴味\",不是\"有后劲\",是\"almost shocked\"。一个每天看技巧发布会的东说念主,被震到了。

fast.ai独创东说念主杰里米·霍华德(Jeremy Howard),开源AI社区最有影响力的声息之一,用词更满:

\"它至少跟Opus 4.8和GPT 5.5一样好。我从未见过这样的开源权重模子。它超等快,不贵,也不啰嗦。回话带有分寸和判断力,处理长坎坷文尽头好。\"

\"至少一样好\",从fast.ai独创东说念主口中说出来,不是轻浅飘的客套。

Redis独创东说念主antirez夸了。深度学习技巧作者塞巴斯蒂安·拉什卡(Sebastian Raschka)把它评为\"今天最佳的开源模子\"。以至连技巧圈最抉剔的那批零丁诞生者,拿着基准测试一条条抠罪戾的,说辞此次也特殊一致。

伊塔马尔·戈兰(Itamar Golan)的纪念最有抽象性:

\"大大都开源模子是这样的:Demo惊艳,benchmark漂亮,本体用起来让东说念主失望。GLM 5.2是第一个嗅觉不一样的。不是说它击败了Opus或GPT。不是说它完整。但它够近了,够近到能改变花样。'够近'等于颠覆开动的处所。\"

一个叫Scott的诞生者用了更逼真是说法:\"第一个不像是benchmaxxing(刷榜优化)的绽放模子。本体使用中很拼,有一股'我颖悟'的劲儿。好多时候,你可能根底翔实不到它跟闭源前沿模子的性能差距。\"

这些话放在一皆,信号很明晰:中国开源模子第一次跨过了一说念热诚门槛,诞生者不再认为在\"拼集\"。

曾在谷歌DeepMind使命过的布兰登·卡尔(Brandon Carl)列了一份名单:维罗索、霍华德、拉什卡、劳赫。\"这些都是分量级东说念主物。\"他的判断是:闭源模子的订价权从此有了天花板。

虽然,任何新模子发布后都有蜜月期。这些评价多来自48小时内的初步使用,永恒发达还需要时辰考证。

二、\"够用\"有多够

但\"够用\"是迟滞的。让咱们把它绝交来。

先看硬数据。零丁评测机构Artificial Analysis把GLM 5.2排在全部模子的第四位,仅次于OpenAI ChatGPT 5.5和Anthropic Claude Opus 4.8,排在谷歌Gemini之前。 开源模子里的历史最高排行。

在长周期编程任务上,GLM 5.2压过了GPT 5.5:SWE-bench Pro得分62.1对58.6,FrontierSWE得分74.4%对72.6%。在器具调用评测MCP-Atlas上,77.0对75.3,相似压过。在一个叫Design Arena的打算任务众测评测中,GLM 5.2拿了第一,以至跨越了Anthropic刚发布的Fable 5,阿谁强到被好意思国政府下令谢绝异邦东说念主使用的模子。

这些不是命运。GLM 5.2在架构底层作念了一项叫IndexShare(索引分享)的重要改造:每四个稀薄翔实力层复用合并个索引器,在100万token坎坷文窗口下,单token揣度量压低了2.9倍。加飞腾级版多Token预测层带来的20%推理成果提高,长周期编程上的率先有结构性的原因。拉什卡在技巧解读中非常指出了这极少。

但基准测试的寰宇有一条暗线,叫教考分离。

挪威国防有计划所的哈瓦德·特维特·伊勒(Havard Tveit Ihle)作念了一项重要有计划。他把中国模子放在公开benchmark和暗里benchmark上分辩测试。公开测试中,中国模子过期好意思国4到6个月。暗里测试中,题目从未公开,模子不可能提前\"见过\",差距拉到8到10个月。简直翻倍。

他的措辞很严慎:中国践诺室可能在\"不测中\"让模子学会应考。

GLM 5.2在两项暗里benchmark上也恪守这个模式:在WeirdML(需要仔细推理的不寻常机器学习任务)上过期约7个月,在SimpleBench(用罗网题测学问推理)上过期整整一年。

但还有另一个数据点。 6月19日,Artificial Analysis发布了一项全新评测,模拟办公室白领的简直使命:从狼籍文献中索要信息、评估相互矛盾的数据。GLM 5.2不可能提前窥探过这套题。结束呢?它压过了4月才发布的ChatGPT 5.5。

\"教考分离\"的规则不是铁板一块。

有些类型的任务,中国模子在追;有些,差距比公开数据看起来大得多。好意思国政府的5月陈说也得出了近似的论断:差距莫得在扩大,但也莫得在减轻。

听起来是追平了。也不错康健成:追上来的速率莫得看起来那么快,但也莫得停驻来。

重要问题是:你垂青哪类任务?

淌若你是一个每天写代码的诞生者,SWE-bench上的发达对你是简直的,GLM 5.2在这个维度上立得住。淌若你需要一个康健奥趣话境、处理绽放式判断的助手,它可能在某些时刻让你认为\"差说合\"。

一个可能的证据是:GLM 5.2在结构化、经过化的使命任务上照旧追平以至突出,但在需要随心判断、尽头规推理的任务上仍有短板。 它的\"够用\"有一个界限,越接近圭表化使命流,越够用;越偏离通例,差距越较着。

不是说它不好。是\"够不够\"这件事,取决于你站在那处。

三、低廉的另一面

然后是价钱。第二层需要绝交。

名义看,GLM 5.2低廉得离谱。API订价:输入每百万token 1.40好意思元,输出4.40好意思元。对比Anthropic Claude Opus 4.8的输出25好意思元,OpenAI GPT 5.5的30好意思元。智谱的编码订阅权谋最低每月12.60好意思元。

编码订阅分三档:Lite版每月12.60好意思元,面向袖珍代码库的轻量迭代;Pro版每月50.40好意思元,5倍于Lite的额度,面向中型代码库日常诞生;Max版每月112.00好意思元,20倍额度,面向重度使命负载,99久久免费国产精久久er精品视频岑岭期享有专属资源。

硅谷AI不雅察者Lisan al Gaib在X上径直开火:\"前沿践诺室在API订价上十足在宰你。\"他列了一组数字:7440亿参数的GLM 5.2收4.40好意思元,1.6万亿参数的DeepSeek V4 Pro收0.87好意思元,而闭源模子收15到30好意思元。\"开源诞生者莫得最新Blackwell芯片也能盈利,证据闭源厂商的利润率可能在90%以上。\"

这个估算只看推理成本。淌若把窥探干涉、研发东说念主员和基础要领一皆算进去,利润率会低得多。但即便如斯,订价空间如实强大于边缘成本。

照旧有东说念主在花钱包投票了。笔据发票处分平台Ramp的数据,6月向DeepSeek支付工作用度的好意思国企业数目急剧增多。据报说念,正在探究在其旗舰Copilot聊天机器东说念主中使用DeepSeek的模子,一家好意思国科技巨头,可能要把我方最蹙迫的AI家具交给一家中国践诺室的模子来驱动。

听着很颠覆。

但佐治亚理工的杜正(Du Zheng)和融合者6月更新的一项有计划,给了一个更复杂的数字:给定调换任务,DeepSeek模子使用了OpenAI竞品23倍的token数目,来达到基本调换的结束。

23倍。

杜正测的是DeepSeek,不是GLM 5.2。但指向的是合并个结构性问题:中国模子倾向于用更多token来想考和输出。这意味着比价不成看\"每个token若干钱\",而要看\"完成一件事所有这个词花了若干token\"。 《经济学东说念主》按这个算法对GLM 5.2作念了测算,在一项软件工程benchmark上,GLM 5.2的总消耗跨越了Anthropic和OpenAI的竞品。

中国模子的才略在提高,但成果莫得同步提高。

听起来是白菜价。也不错康健成:模子得多干23说念工序才略交卷,按token计价的低廉不一定是真低廉。低廉未低廉,取决于你用得多深。

轻量使用,问几个问题、写一段代码,GLM 5.2如实省钱。重度使用,永劫辰自主编程、复杂多要领推理,总成本可能反过来。

自制地说,智谱提供了一个缓解决策:缓存输入token的订价降到每百万0.26好意思元,何况当今免费提供缓存存储。关于反复调用调换坎坷文的场景,这能大幅压缩成本。重要看你的使命模式。

四、不设锁

GLM 5.2发布的时机,恰恰也好,成心也好,时辰线上的戏剧性是简直的。

6月12日,特朗普政府见知Anthropic,谢绝非好意思国公民使用Fable 5。Anthropic的回话是把模子全面下线。 一个闭源模子,前一天照旧诞生者手中最佳的器具之一,第二天就没法用了。

24小时后,6月13日下昼5点21分,北京时辰,GLM 5.2发布。 MIT开源许可证。无区域达成。无使用达成。不错下载、修改、商用,不需要付版税,不需要答应任何\"可继承使用\"策略。

智谱皆集独创东说念主唐杰(Tang Jie)在发布会上说了一句:\"咱们的魄力是激进绽放。\"他接着炮轰\"外部禁闭\",指的等于Anthropic和好意思国政府联手制造的那种形式,说这让AI系统\"随时不错被打消\"。

这不是技巧比拼。这是交易模式、用户信任和外部策略的三重交叉点。

一个企业CTO靠近的选拔形成了这样:这边是Anthropic,模子很强,但好意思国政府一句话就能让你的团队断供。那边是GLM 5.2,模子够用,你不错部署在我方的工作器上,谁也断不了你的供。

关于好意思国除外的企业,欧洲、东南亚、拉好意思,这说念选拔题莫得那么难作念。

Anthropic我方最近在一份陈说中警告,中国AI正靠拢好意思国。陈说说好意思国偏捏盟友还有契机\"锁定12到24个月的前沿率先上风\"。但陈说的潜台词是:\"这个窗口不会一直开着。\"

一边在拉刹车,另一边在踩油门。

Anthropic说的是\"咱们率先但未几\",作念的是把模子下线让用户焦头烂额。智谱说的是\"激进绽放\",作念的是把模子权重径直扔到Hugging Face上,MIT许可证。

凯文·辛巴克(Kevin Simback)在X上指出了一个冷峻的问题:\"模子好不等于收入好。西方企业,简直的AI金主,可能在土产货部署,钱根底到不了智谱手里。编码订阅权谋的订价跟Anthropic和OpenAI差未几,或然有若干东说念主转投。\"

翻译一下:MIT许可证让模子无处不在,但也让钱很难流回诞生者口袋。对用户是礼物,对智谱的财务报表或然。

虽然,那是成本市集的逻辑。对用户来说,多一个不受好意思国开关限定的选拔,自己等于价值。

五、那说念线

回到戈兰那句话:\"够近\"等于颠覆开动的处所。

GLM 5.2不是最强的模子。它在一些维度上赶不上Anthropic和OpenAI的旗舰,在暗里基准测试上的差距大致比公开数据更大,token成果还有较着短板。

但它跨过了一条线。

这条线之前,开源模子是\"尝鲜\",诞生者下载试试,第二天换回闭源模子干活。这条线之后,开源模子不错当\"日常用车\",你不错在它上头简直使命了。

这条线的名字叫够用线。一朝跨过,游戏规矩就变了。

不是开源会取代闭源。是闭源不成再仅凭\"咱们最佳\"来订价,因为\"第二好\"照旧够好了。当够用线和最佳之间的差距,小于价签上的差距,预算表会替诞生者作念选拔。

马斯克在X上说,他瞻望中国在来岁头赶上现时前沿水平。唐杰回了一句:\"用不了那么久。\"

那场硅谷列队点赞发生在6月的第二个周末。到了周一,一切看起来照旧老神气,诞生者写代码,公司审预算,好意思国政府发禁令。

但维罗索说的那句话,挂在X的时辰线上,被转了又转:

\"事情不会一样了。\"

下一篇:没有了
推荐资讯
友情链接: