更广泛的基准测试显示这是一个全能型模型。GLM-5.1在AIME 2026获95.3分,HMMT 2025年11月版获94.0分,HMMT 2026年2月版获82.6分,研究生级科学推理基准GPQA-Diamond获86.2分。在智能体与工具使用基准方面,CyberGym得分68.7(较GLM-5的48.3实现大幅跃升),BrowseComp获68.0分,τ³-Bench获70.6分,MCP-Atlas(公开集)获71.8分——最后一项尤其重要,因为MCP在生产环境智能体系统中的重要性日益凸显。在Terminal-Bench 2.0中模型取得63.5分,使用Claude Code作为脚手架时升至66.5分。
最后专家建议同床伴侣各自分开盖被。他解释称每人体温调节机制存在差异,若热舒适度不匹配将严重影响睡眠质量。
,更多细节参见搜狗输入法候选词设置与优化技巧
“防化先锋连”的突出表现远不止于此。
6 апреля 2026, 09:42Экономические новости