火狐直播2026世界杯比赛直播 Fable 5突遭下架,GLM-5.2全量盛开

 88    |      2026-06-14 17:48

火狐直播2026世界杯比赛直播 Fable 5突遭下架,GLM-5.2全量盛开

新智元报谈

【新智元导读】GLM-5.2全量盛开!1M高下文真能用,长任务不忘事。

昨晚,Claude Fable 5被好意思国政府一封信平直群众下架。

上线才72小时,说没就没。连Anthropic自家外籍职工齐不许碰。数亿用户一醒觉来,平直懵了。

老外我方先坐不住了,梗图满天飞——Anthropic何处说「咱们的模子太危境了」,好意思国政府回一句「那我禁了」。

就在刚刚,国产模子修起来了:GLM-5.2,全量用,最高权限开源。

GLM Coding Plan 全量用户盛开,Lite、Pro、Max、团队版,今晚全部能用!

下周API上线,MIT合同开源,权重毁坏拿。

一边在关门,一边在开门。

从GLM-5到5.1再到今晚的5.2,智谱在Coding这条路上死磕了整整一年。

5.1刚把开源模子推到8小时长程任务,社区响应还很热,5.2就平直把高下文怼到了1M——况兼是那种真能用的1M!

此次GLM-5.2有两个重要词:真1M高下文,Coding国产之光。

到底怎么样?全网齐在等Bench

在Anthropic这一通操作的配景之下,5.2模子刚一文书要开源,国外社区就炸了。

国外闻名博主AICodeKing在内测完给出的评价终点平直:这个模子品位出色,代码历久相配干净。我让它微调一个完满的土产货模子,30分钟就责罚了。全观点齐发扬优异。

目下已公布的建造者实测Bench来看,性能基本对标Opus 4.8——实打实的国产之光。

智谱其真实前两天就灵通了coding plan用户的一波内测(在最近的AI圈发模子中亦然惯例操作了)

而咱们潜水的内测社群里,体感响应也一致得吓东谈主。

有网友默示,「这是国内第一款在我责任流上达到Opus级的模子」。

另一位内测用户更直白——「用过5.2回不去5.1了,在大名堂内部有种4.7到5的跨越式逾越。上面的嗅觉。」

知乎上以至有东谈主说:「从下周初始,通过中转站用Opus的东谈主必须靠近一个问题——你用的Opus要是是GLM-5.2冒充的,你可能分歧不出来,以至发扬更好。」

官方Bench还没出全,全网齐在等。但就目下建造者我方跑出来的数据和体感来看,Coding国产第一这个位置,GLM-5.2坐得稳。

第一时刻拿到内测经验后,咱们也迫不足待地上手实测了下。竟然和之前的模子不不异。

一语气写完,三种寻路算法全跑对了

让GLM-5.2写一个寻路算法可视化器。它给你一次责罚。

A*、Dijkstra、BFS——三种算法各有各的套路,一个齐没搞混。

连优先队伍齐是我方写的,不是拿现成的库哄骗。

最狠的是分屏对比:两种算法同期跑,各走各的路、各算各的数,画面上五颜六色地铺开——这等于一个文献里同期管两套零丁的搜索流程,现象一串就全乱。它没串。

六套逻辑塞在一个文献里,从新到尾齐不打架——算法、动画、交互、对比、统计、迷宫生成,全记住,全对着。

Coding跟长高下文的真功夫,就体当今这种地点。

长任务,不忘事

GLM-5.1照旧能连气儿自主责任8小时,但念念再往前推,绕不开一个坎:高下文。

一个连气儿干几小时活的智能体,要经历数千次器用调用、读写几万行代码、攒下一大堆中间现象。

窗口不够长,它就得不断压缩、丢弃。许多长任务翻车,不是模子不够智慧,是它忘了。

是以1M高下文的真谛真谛,不是参数表上一个更大的数字,而是让模子能把整个这个词名堂一语气吃进去——代码、有狡计、敛迹全记住,从新干到尾不丢东西。

当今标称1M的模子不少,但用过的东谈主齐有体感:喂进去是喂进去了,记不太住。

许多模子过了25万token就初始「失忆」;况兼高下文越长,火狐直播2026世界杯比赛直播算力和显存烧得越猛——不是不行跑,是跑起来又慢又贵,没东谈主敢这样用。

从结构下手,用一套驻防力层面的翻新组合拳,把1M长度下的后果衰减和推理老本全部压了下来。

在长文基准上,GLM-5.21M长度的衰减彰着小于同类模子。

连气儿干了4小时,搓出一整个这个词合成器责任站

这个case最能施展「长任务,不忘事」到底意味着什么。

一句话需求扔往常——作念一个专科级的HTML音乐合成器责任站,WebAudio,零依赖。

然后它就初始干了。不是干几分钟,是整整4个小时,一语气,中间没东谈主干预。

4个小时里它我方写代码、我方组了29个review智能体从4个维度对着我方的代码挑罪状、揪出18个bug全部修掉、还跑了Headless Chrome自动化测西宾证完满音频链路。

最狠的是,自动测试还捏到了一个review齐没发现的致命bug,它我方修了。

最终托付:177,000个token的责任量,一个回合完成。

这即是1M高下文的真谛真谛。

4小时、17万token、几十个模块的现象全攥在手里不丢——这是「记性好」。

而记性好,恰正是长任务能不行托付的死活线。

74万多条日记喂进去,它没忘伊始

咱们平直把一整月、几十万token的奇迹器日记全塞给GLM-5.2,让它揪出一个月前埋下的雪崩苗头。

5月28日的雪崩谁齐看得见,但GLM-5.2把根因一齐倒推回了5月3日那条藏在第661行的麇集池恭候教养。

那条WARN那时还自愈着、归并在几千条往常日记里,绝不起眼。

月末爆发时,它还能精准援用到月初的原始行号和时刻戳,把「麇集池满载 → 慢性鸠合 → 透澈破钞 → 级联503」串成一条完满的因果链。

短高下文模子跑到日记尾段,伊始那条火种早就被压缩、丢弃了——它只可告诉你「5月28日崩了」,给不出为什么会崩。

能从收尾念念起伊始,长高下文才信得过酿成了推理能力。

上千行代码,三种玩法各有各的物理律例

让GLM-5.2跑一个 2D 粒子物理模拟器。

目田格式里粒子彼此眩惑、碰撞了还会合并成更大的——质料加在全部、速率按比例分派。

物理教材上那套动量守恒它能老真挚实玩显然了。

切到轨谈格式,律例整个这个词换了一套:独一中间那颗大星球眩惑别东谈主,小粒子之间不对并,否则轨谈全乱。

再切烟花格式,引力又酿成往下掉的重力,粒子还会冉冉变暗隐没。

三种格式共用一套画面轮回,但「力怎么算、撞了怎么办、要不要隐没」全按格式分开处理,干净利落。

一千多行代码从新写到尾,前边定的律例背面全记住,没一处水火不容。

4份合同全部喂,跨文档揪出避讳矛盾

4份合同、几万字,一次性全喂进去,它没看花眼。

2026世界杯买球赛的正规app

最见功力的是:合同3说「打讼事」,合同1却说「走仲裁」,它一眼识破这俩凑一块儿会「打架」,还拔树寻根把两份合同串了起来。

这种活,得同期把4份合同攥在脑子里才作念得出来。

长高下文在这儿不是「塞得下」,是「难忘住、对得上、能交叉」。

前沿智能,不该说没就没

回到伊始那件事。

Fable 5上线3天就被强制下架,群众建造者发现我方赖以责任的模子说没就没了。依赖Fable 5构建居品的团队,奇迹平直挂掉。

你弥远不知谈我方手里的器用什么时刻会被一封信收走。

在国外闭源前沿模子打听不信服性飞腾的配景下,国产开源模子的含金量还在进步。

写在临了

智谱对持coding模子照旧杰出1年了,此次把建造者千呼万唤的1M、长任务这些照旧不簇新的词作念「solid」:让中国建造者手里这台Coding模子,是真能扛复杂大活的那种可用,不再是榜单上顺眼、用起来打折。

智谱给此次发布写了一句话,下昼被AI圈刷屏:前沿智能,不该只属于少数东谈主,也不该被少数律例随时收回。它应该盛开、可用、可构建,奇迹每一位建造者。

这句话听着火狐直播2026世界杯比赛直播,额外真实,GLM不竭加油。