你的位置:人妻夜夜天天爽一区 > 产品展示 >

用编程大模子登顶开源第一后,智谱GLM团队被拷问了3小时

金磊 发自 凹非寺

量子位 | 公众号 QbitAI

真实越到年底,越是至人打架。

这不,智谱又又又发了新模子——GLM-4.7。

然后一举在代码竞技场WebDev榜单上超越GPT-5.2,拿下开源大模子第一!

咫尺网友们也正在拿它豪恣实测中,体验完简直都是清一色的“Amazing”。

径直来感受一下网友拿着GLM-4.7和Gemini 3同期作念的桌版溜溜球游戏,让网友直呼:

GLM-4.7完胜!

视频地址:https://mp.weixin.qq.com/s/AwYgbzPU6Gix61NpEMXezw

那么,为什么GLM-4.7此次会在编程成果上有这样大的卓绝?

就在今天早些时候,智谱还荒谬在Reddit上举办了一场AMA(Ask Me Anything)活动,对于背后的一切,都依然回答得显着明了。

对于GLM-4.7,智谱回答一切

这场对话不仅揭示了GLM-4.7如何通事后执行完竣性能飞跃,还初度深度曝光了自研的强化学习框架——Slime。

咱们整理了这场AMA的中枢精华,望望这个被称为“Claude Code最好平替”的国产模子,究竟是怎么真金不怕火成的。

模子性能与优化

伊始就是各人最为暖热的,为什么GLM-4.7会在体感上有如斯彰着的卓绝。

智谱团队在AMA中明确暗意,GLM-4.7的校正主要蚁合在后执行阶段。

在SFT(监督微调)和RL(强化学习)阶段,团队遴选了更精细的发布配方(Release Recipe)。通过对不同界限数据集的对都,模子不仅在基准测试上跑分更高,在本色部署中的厚实性也大幅普及。

而针对社区对于“为何不出更大参数目模子”的疑问,智谱团队直言:

执行成本和部署成本是缱绻的中枢锚点。

GLM-4.7在缱绻之初就商酌了硬件戒指。团队方针是让模子在奢靡级显卡上也能跑出Air版块的活泼性,同期保持接近30B以至更高范围的逻辑才智。这种在有限参数下压榨极致性能的念念路,恰是为了让AI的确落地。

除此以外,智谱共享了他们诞生的一套复杂的预执行数据经过:

多源辘集: 涵盖从高质料论文到演义等万般文本。极致清算: 包含去重、质料过滤和敏锐词筛查。对都计策: 要点关注SFT和RL阶段,让写稿作风不再像机器东说念主,而是愈加生动细巧。

模子讹诈场景与功能

如果说畴前的GLM是个有些古板的理科生,那么4.7版块则是完成了一次情商逆袭。

在AMA中,开导者问得最多的就是编程。智谱团队坦言,他们针对Claude Code作念了大量的优化和适配责任。

咫尺,GLM-4.7在多谈话编码方面发扬出色,不仅救济Python、JS,在一些相对冷门的谈话和复杂的逻辑架构上也展现了极强的厚实力。

团队合计,智能体框架对性能的影响占比高达30%,因此GLM-4.7在系统领导词、用具调用层级上作念了深度打磨。

为了让模子更像东说念主,团队从大量演义和脚本中采纳营养。

咫尺的GLM-4.7在创意写稿时,细节描写愈加丰富,不再只会说“在一个阳光明媚的下昼”这种套话。在变装束演任务中,它能更好地保管东说念主设,减少出戏的频率。

除此以外,GLM-4.7还引入了一个终点硬核的功能:交错念念考(Interleaved Thinking)。

在履步履作或调用用具之前,模子会先进行一段隐性念念考。这种近似OpenAI o1的念念维链机制,让它在处理复杂的多模态任务(如看图写代码、图表分析)时,减少了敷衍操作的概率,提高了准确度。

本领门径与用具

智谱之是以在国外社区受迎接,与其积极拥抱开源的立场密不成分。

此次AMA最让东说念主惊喜的莫过于Slime框架的公开。

为了处罚大模子强化学习遵循低、厚实性差的问题,智谱研发并开源了Slime。

这个框架专为大范围强化学习缱绻,救济多种对都算法。它的名字寓意着“活泼且具有极强妥贴性”,能够匡助开导者更容易地复现GLM级别的对都成果。

智谱暗意,他们从开源生态中获益良多,因此也乐于回馈。

他们详备刻画了从数据辘集、清算到质料过滤的完整活水线。这种透明度在咫尺的国产大模子厂商中并未几见,也获取了LocalLLaMA社区的一致尊重。

在 Reddit 上,智谱团队展现了极其接地气的一面。

有效户问:“你们执行时碰到最就怕的挑战是什么?”

团队回答:“最大的挑战其实是发布配方。就像厨师手里有最好的食材(数据),但怎么掌抓火候(RL参数)让它在出锅时最圆善,时常需要无数次的推倒重来。”

还有东说念主嘲谑:“GLM-4.7是不是吃了什么灵丹灵药?”

团队则幽默恢复:“主若是咱们学会了如何让它在步履之前多想一想。”

实测GLM-4.7

在了解完GLM-4.7背后的“奇技淫巧”之后,咱们如故老划定,一波实测走起~

伊始值得严防的是,咫尺在z.ai上搞开导,最好是点开“全栈开导”的按钮:

然后咱们先作念一个植物大战僵尸来小试牛刀,Prompt如下:

请基于刻下目次准备的素材(下载 https://z-cdn.chatglm.cn/temp/Grazy Dave.mp3 手脚游戏音乐, 下载 https://z-cdn.chatglm.cn/temp/pvc-images.zip 目次下的万般植物与僵尸静态/GIF图片、Pea.png/PeaSnow.png豆子素材、Shop.png/Card.png界面素材及Sun.gif),作念一个《植物大战僵尸》游戏。

不错看到,相似是经典的测试游戏,此次在体感上是“声色俱全”的那种(体验衔接放底下了):

https://chat.z.ai/c/5415b1d8-ac01-4bc6-a24a-8e815c8fa361

除了游戏以外,GLM-4.7另一个体感上的跃迁,即是作念PPT了,这个demo的Prompt极其浅陋:

作念一个先容巴黎的PPT。

不错看到,PPT的成果依然达到了径直商用的进度:

除此以外,作念海报亦然GLM-4.7的一绝。

举例缱绻一张宣传畅通鞋的海报,对比GLM-4.6和GLM-4.7,成果的差距就一目了然了:

从万般成果来看,也就不难厚实为什么此次GLM-4.7会在X上被刷屏了。

答应上市后不时开源

在此次AMA中,除了本领硬核细节,围不雅全球最暖热的莫过于智谱要上市的事情了。

毕竟最近对于智谱拟赴港IPO的音讯激励了圈内不小的关注。

Reddit上有资深老哥利害提问:“一朝公司上市,你们是否会缩减开源参加?”

智谱团队给出了一个终点强硬的安然丸:“开源是咱们的中枢基因,无论老本旅途如何变化,咱们答应上市后将不时开源。”

团队解释说念,智谱深知其成长离不开开源生态的滋补。不时开源不仅是回馈,更是保持本领伊始、诞生开导者圭臬的最优旅途。这种“即便敲钟,也要开卷”的姿态,如实让不少国外开导者直呼“Respect”。

通过交错念念考普及才略上限,通过Slime框架次序执行经过,智谱正在用最硬核的姿色诠释:国产模子不仅能跑分,更能实战。

何况从用户们的响应来看,GLM-4.7以及智谱始终以来的责任亦然被给以了高度的招供。

举例有网友从价钱角度评价说:

GLM 4.7的1年订阅(接近Opus 4.5级别)= Codex/Claude Code的1个月Max Plan。

我咫尺就立马订一年的。

包括估值40亿好意思元的Fireworks也在Day0救济GLM 4.7,嗯,好意思国东说念主亦然有更好的模子遴荐了。

除此以外,在AMA的中,智谱团队说了一句让东说念主期待的话:“咱们会为了AGI在来岁作念更多的孝顺。”

在此基础之上,智谱首席科学家唐杰在GLM-4.7发布之际发表了他对于大模子发展的一些不雅点。

原衔接:https://weibo.com/2126427211/QjIYhCmfq

在IPO的灯光亮起之前,智谱遴荐先点亮开导者的屏幕。这种始终看法的狂放,卤莽恰是大模子期间最稀缺的底色。

— 完 —

量子位 QbitAI · 头条号

关注咱们,第一时辰获知前沿科技动态