用编程大模子登顶开源第一后，智谱GLM团队被拷问了3小时

你的位置：人妻夜夜天天爽一区 > 产品展示 >

产品展示

用编程大模子登顶开源第一后，智谱GLM团队被拷问了3小时

金磊发自凹非寺

量子位 | 公众号 QbitAI

真实越到年底，越是至人打架。

这不，智谱又又又发了新模子——GLM-4.7。

然后一举在代码竞技场WebDev榜单上超越GPT-5.2，拿下开源大模子第一！

咫尺网友们也正在拿它豪恣实测中，体验完简直都是清一色的“Amazing”。

径直来感受一下网友拿着GLM-4.7和Gemini 3同期作念的桌版溜溜球游戏，让网友直呼：

GLM-4.7完胜！

视频地址：https://mp.weixin.qq.com/s/AwYgbzPU6Gix61NpEMXezw

那么，为什么GLM-4.7此次会在编程成果上有这样大的卓绝？

就在今天早些时候，智谱还荒谬在Reddit上举办了一场AMA（Ask Me Anything）活动，对于背后的一切，都依然回答得显着明了。

对于GLM-4.7，智谱回答一切

这场对话不仅揭示了GLM-4.7如何通事后执行完竣性能飞跃，还初度深度曝光了自研的强化学习框架——Slime。

咱们整理了这场AMA的中枢精华，望望这个被称为“Claude Code最好平替”的国产模子，究竟是怎么真金不怕火成的。

模子性能与优化

伊始就是各人最为暖热的，为什么GLM-4.7会在体感上有如斯彰着的卓绝。

智谱团队在AMA中明确暗意，GLM-4.7的校正主要蚁合在后执行阶段。

在SFT（监督微调）和RL（强化学习）阶段，团队遴选了更精细的发布配方（Release Recipe）。通过对不同界限数据集的对都，模子不仅在基准测试上跑分更高，在本色部署中的厚实性也大幅普及。

而针对社区对于“为何不出更大参数目模子”的疑问，智谱团队直言：

执行成本和部署成本是缱绻的中枢锚点。

GLM-4.7在缱绻之初就商酌了硬件戒指。团队方针是让模子在奢靡级显卡上也能跑出Air版块的活泼性，同期保持接近30B以至更高范围的逻辑才智。这种在有限参数下压榨极致性能的念念路，恰是为了让AI的确落地。

除此以外，智谱共享了他们诞生的一套复杂的预执行数据经过：

多源辘集：涵盖从高质料论文到演义等万般文本。极致清算：包含去重、质料过滤和敏锐词筛查。对都计策：要点关注SFT和RL阶段，让写稿作风不再像机器东说念主，而是愈加生动细巧。

模子讹诈场景与功能

如果说畴前的GLM是个有些古板的理科生，那么4.7版块则是完成了一次情商逆袭。

在AMA中，开导者问得最多的就是编程。智谱团队坦言，他们针对Claude Code作念了大量的优化和适配责任。

咫尺，GLM-4.7在多谈话编码方面发扬出色，不仅救济Python、JS，在一些相对冷门的谈话和复杂的逻辑架构上也展现了极强的厚实力。

团队合计，智能体框架对性能的影响占比高达30%，因此GLM-4.7在系统领导词、用具调用层级上作念了深度打磨。

为了让模子更像东说念主，团队从大量演义和脚本中采纳营养。

咫尺的GLM-4.7在创意写稿时，细节描写愈加丰富，不再只会说“在一个阳光明媚的下昼”这种套话。在变装束演任务中，它能更好地保管东说念主设，减少出戏的频率。

除此以外，GLM-4.7还引入了一个终点硬核的功能：交错念念考（Interleaved Thinking）。

在履步履作或调用用具之前，模子会先进行一段隐性念念考。这种近似OpenAI o1的念念维链机制，让它在处理复杂的多模态任务（如看图写代码、图表分析）时，减少了敷衍操作的概率，提高了准确度。

本领门径与用具

智谱之是以在国外社区受迎接，与其积极拥抱开源的立场密不成分。

此次AMA最让东说念主惊喜的莫过于Slime框架的公开。

为了处罚大模子强化学习遵循低、厚实性差的问题，智谱研发并开源了Slime。

这个框架专为大范围强化学习缱绻，救济多种对都算法。它的名字寓意着“活泼且具有极强妥贴性”，能够匡助开导者更容易地复现GLM级别的对都成果。

智谱暗意，他们从开源生态中获益良多，因此也乐于回馈。

他们详备刻画了从数据辘集、清算到质料过滤的完整活水线。这种透明度在咫尺的国产大模子厂商中并未几见，也获取了LocalLLaMA社区的一致尊重。

在 Reddit 上，智谱团队展现了极其接地气的一面。

有效户问：“你们执行时碰到最就怕的挑战是什么？”

团队回答：“最大的挑战其实是发布配方。就像厨师手里有最好的食材（数据），但怎么掌抓火候（RL参数）让它在出锅时最圆善，时常需要无数次的推倒重来。”

还有东说念主嘲谑：“GLM-4.7是不是吃了什么灵丹灵药？”

团队则幽默恢复：“主若是咱们学会了如何让它在步履之前多想一想。”

实测GLM-4.7

在了解完GLM-4.7背后的“奇技淫巧”之后，咱们如故老划定，一波实测走起~

伊始值得严防的是，咫尺在z.ai上搞开导，最好是点开“全栈开导”的按钮：

然后咱们先作念一个植物大战僵尸来小试牛刀，Prompt如下：

请基于刻下目次准备的素材（下载 https://z-cdn.chatglm.cn/temp/Grazy Dave.mp3 手脚游戏音乐，下载 https://z-cdn.chatglm.cn/temp/pvc-images.zip 目次下的万般植物与僵尸静态/GIF图片、Pea.png/PeaSnow.png豆子素材、Shop.png/Card.png界面素材及Sun.gif），作念一个《植物大战僵尸》游戏。

不错看到，相似是经典的测试游戏，此次在体感上是“声色俱全”的那种（体验衔接放底下了）：

https://chat.z.ai/c/5415b1d8-ac01-4bc6-a24a-8e815c8fa361

除了游戏以外，GLM-4.7另一个体感上的跃迁，即是作念PPT了，这个demo的Prompt极其浅陋：

作念一个先容巴黎的PPT。

不错看到，PPT的成果依然达到了径直商用的进度：

除此以外，作念海报亦然GLM-4.7的一绝。

举例缱绻一张宣传畅通鞋的海报，对比GLM-4.6和GLM-4.7，成果的差距就一目了然了：

从万般成果来看，也就不难厚实为什么此次GLM-4.7会在X上被刷屏了。

答应上市后不时开源

在此次AMA中，除了本领硬核细节，围不雅全球最暖热的莫过于智谱要上市的事情了。

毕竟最近对于智谱拟赴港IPO的音讯激励了圈内不小的关注。

Reddit上有资深老哥利害提问：“一朝公司上市，你们是否会缩减开源参加？”

智谱团队给出了一个终点强硬的安然丸：“开源是咱们的中枢基因，无论老本旅途如何变化，咱们答应上市后将不时开源。”

团队解释说念，智谱深知其成长离不开开源生态的滋补。不时开源不仅是回馈，更是保持本领伊始、诞生开导者圭臬的最优旅途。这种“即便敲钟，也要开卷”的姿态，如实让不少国外开导者直呼“Respect”。

通过交错念念考普及才略上限，通过Slime框架次序执行经过，智谱正在用最硬核的姿色诠释：国产模子不仅能跑分，更能实战。

何况从用户们的响应来看，GLM-4.7以及智谱始终以来的责任亦然被给以了高度的招供。

举例有网友从价钱角度评价说：

GLM 4.7的1年订阅（接近Opus 4.5级别）= Codex/Claude Code的1个月Max Plan。

我咫尺就立马订一年的。

包括估值40亿好意思元的Fireworks也在Day0救济GLM 4.7，嗯，好意思国东说念主亦然有更好的模子遴荐了。

除此以外，在AMA的中，智谱团队说了一句让东说念主期待的话：“咱们会为了AGI在来岁作念更多的孝顺。”

在此基础之上，智谱首席科学家唐杰在GLM-4.7发布之际发表了他对于大模子发展的一些不雅点。

原衔接：https://weibo.com/2126427211/QjIYhCmfq

在IPO的灯光亮起之前，智谱遴荐先点亮开导者的屏幕。这种始终看法的狂放，卤莽恰是大模子期间最稀缺的底色。

— 完 —

量子位 QbitAI · 头条号

关注咱们，第一时辰获知前沿科技动态

下一篇：情谊微电影30秒片断，一次安全遴荐，两种东说念主生结局上一篇：海南琼海一中学“百万年薪+百万房产”选聘校长，来自四川的“80后”陈默拟任！

用编程大模子登顶开源第一后，智谱GLM团队被拷问了3小时

友情链接：