智谱GLM-4.7正式上线开源：编码能力国际顶尖，开源、国产双第一

发布人：皇甫大双发布时间：2025-12-26 浏览次数:10

12月23日，智谱AI正式发布并开源GLM-4.7大模型，随即在社交平台引发热议。最新版本大模型在编码能力、长程任务规划与工具协同三个核心维度实现重要突破，在多项主流公开基准测试中表现优异，在开源模型中处于领先地位。

一、编码能力显著提升

GLM-4.7在编程能力上实现了实质性进展。公开数据显示，该模型在多语言编码和终端智能体场景下表现突出，目前已可在Claude Code、TRAE、Kilo Code、Cline、Roo Code等多个编程框架中实现“先思考、再行动”的机制，在复杂任务处理上展现出更强的稳定性。

在权威的Code Arena全球编码评估系统中，GLM-4.7位列开源第一、国产第一，超过GPT-5.2。多项主流基准测试结果显示，其代码能力已对标Claude Sonnet 4.5水平。

二、基准测试数据表现亮眼

在主流基准测试中，GLM-4.7取得亮眼表现。在SWE-bench-Verified测试中获得开源第一成绩，相较上一代GLM-4.6提升5.8%；在LiveCodeBench V6评测中，取得了84.9分的优异成绩，不仅刷新了开源SOTA纪录，更成功超越了Claude Sonnet 4.5。总体而言，新模型在代码修复、多语言编程及终端操作等核心任务上的成功率大幅提升，是截至目前国产大模型中代码表现最出色的版本。

在工具调用能力方面，该模型在BrowseComp网页任务评测中获得67.5分，在τ²-Bench交互式工具调用评测中更是以87.4分的成绩实现开源SOTA，超越Claude Sonnet 4.5。

除编码能力外，GLM-4.7在数学和推理方面也有所提升。在HLE基准测试中获得42.8%的成绩，较GLM-4.6提升41%，超过GPT-5.1。模型在对话中表现更为简洁智能，写作与角色扮演更具文采与沉浸感。

三、赋能应用升级

GLM-4.7进一步强化了思考能力，引入交错式思考、保留式思考与轮级思考三种模式。交错式思考在每次回答或工具调用前进行思考，提升复杂指令遵循能力；保留式思考在多轮对话中自动保留思考块，提升缓存命中率；轮级思考则支持按“轮”控制推理开销，实现简单任务与复杂任务的差异化处理。

在前端生成方面，GLM-4.7质量明显进步，能够生成观感更佳的网页、PPT、海报。办公创作中，PPT 16:9适配率从52%跃升至91%，海报设计的排版与配色更加灵活。

四、开发者积极反馈

GLM-4.7已通过BigModel.cn提供API服务，并在z.ai全栈开发模式中上线全新Skills模块，支持多模态任务的统一规划与协作执行。

来自开发者社区的反馈显示，GLM-4.7在前端设计美学、复杂功能完成度、工具并发和指令遵循等方面均有明显提升，同时推理速度更快、token效率更高，整体任务端到端完成度与稳定性大幅增强。

多家技术平台表示，GLM-4.7上线后为用户提供了稳定的编程辅助支持，助力开发者高效解决各类编程需求。

为促进人工智能发展，北京市发展改革委支持建设了一批公共算力基础设施，GLM-4.6、4.7等系列均依托北京市公共算力平台完成训练研发。此外，该平台还为百度、智源研究院、中关村学院等主体的创新实践提供了坚实算力保障，成功孵化一批重要成果。