智谱GLM-4.7正式上线开源:编码能力国际顶尖,开源、国产双第一
发布人:皇甫大双  发布时间:2025-12-26   浏览次数:10

12月23日,智谱AI正式发布并开源GLM-4.7大模型,随即在社交平台引发热议。最新版本大模型在编码能力、长程任务规划与工具协同三个核心维度实现重要突破,在多项主流公开基准测试中表现优异,在开源模型中处于领先地位。

一、编码能力显著提升

GLM-4.7在编程能力上实现了实质性进展。公开数据显示,该模型在多语言编码和终端智能体场景下表现突出,目前已可在Claude Code、TRAE、Kilo Code、Cline、Roo Code等多个编程框架中实现“先思考、再行动”的机制,在复杂任务处理上展现出更强的稳定性。

在权威的Code Arena全球编码评估系统中,GLM-4.7位列开源第一、国产第一,超过GPT-5.2。多项主流基准测试结果显示,其代码能力已对标Claude Sonnet 4.5水平。

二、基准测试数据表现亮眼

在主流基准测试中,GLM-4.7取得亮眼表现。在SWE-bench-Verified测试中获得开源第一成绩,相较上一代GLM-4.6提升5.8%;在LiveCodeBench V6评测中,取得了84.9分的优异成绩,不仅刷新了开源SOTA纪录,更成功超越了Claude Sonnet 4.5。总体而言,新模型在代码修复、多语言编程及终端操作等核心任务上的成功率大幅提升,是截至目前国产大模型中代码表现最出色的版本。

在工具调用能力方面,该模型在BrowseComp网页任务评测中获得67.5分,在τ²-Bench交互式工具调用评测中更是以87.4分的成绩实现开源SOTA,超越Claude Sonnet 4.5。

除编码能力外,GLM-4.7在数学和推理方面也有所提升。在HLE基准测试中获得42.8%的成绩,较GLM-4.6提升41%,超过GPT-5.1。模型在对话中表现更为简洁智能,写作与角色扮演更具文采与沉浸感。

三、赋能应用升级

GLM-4.7进一步强化了思考能力,引入交错式思考、保留式思考与轮级思考三种模式。交错式思考在每次回答或工具调用前进行思考,提升复杂指令遵循能力;保留式思考在多轮对话中自动保留思考块,提升缓存命中率;轮级思考则支持按“轮”控制推理开销,实现简单任务与复杂任务的差异化处理。

在前端生成方面,GLM-4.7质量明显进步,能够生成观感更佳的网页、PPT、海报。办公创作中,PPT 16:9适配率从52%跃升至91%,海报设计的排版与配色更加灵活。

四、开发者积极反馈

GLM-4.7已通过BigModel.cn提供API服务,并在z.ai全栈开发模式中上线全新Skills模块,支持多模态任务的统一规划与协作执行。

来自开发者社区的反馈显示,GLM-4.7在前端设计美学、复杂功能完成度、工具并发和指令遵循等方面均有明显提升,同时推理速度更快、token效率更高,整体任务端到端完成度与稳定性大幅增强。

多家技术平台表示,GLM-4.7上线后为用户提供了稳定的编程辅助支持,助力开发者高效解决各类编程需求。

为促进人工智能发展,北京市发展改革委支持建设了一批公共算力基础设施,GLM-4.6、4.7等系列均依托北京市公共算力平台完成训练研发。此外,该平台还为百度、智源研究院、中关村学院等主体的创新实践提供了坚实算力保障,成功孵化一批重要成果