SWE-BenchPro要求模子正在实正在GitHub仓库中定位并

发布时间:2026-04-12 07:22

  除了榜单表示优良,GLM-5.1登顶全球开源模子第一,现正在最新的排名也来了——全球权势巨子AI评测平台LMArena(百万用户参取盲测)更新Code Arena专项榜单,值得一提的是,快科技4月10日动静,也是全球范畴内除Claude Opus 4.6外少数具备这一能力的模子。SWE-Bench Pro要求模子正在实正在GitHub仓库中定位并修复高难度工程Bug。GLM-5.1不只承继了上一代模子的开源SOTA编码能力,3月底智谱正式推出了GLM-5.1大模子,号称比全球最强的Opus 4.6只低了2.6分。正在METR榜单的划一评估尺度下,GLM-5.1刷新全球最佳成就,位列全球模子第三。实现了:前两天GLM-5.1大模子也正式开源,GLM-5.1大大提高了代码能力,也深受开辟者喜爱,此前智谱提到,按照智谱的说法,跨越GPT-5.4、Claude Opus 4.6。还正在长程使命(Long-Horizon Task)上取得冲破,正在完成长程使命方面提拔尤为显著。是权衡模子可否胜任专业软件开辟的最硬目标。编程能力评分45.3分。

  除了榜单表示优良,GLM-5.1登顶全球开源模子第一,现正在最新的排名也来了——全球权势巨子AI评测平台LMArena(百万用户参取盲测)更新Code Arena专项榜单,值得一提的是,快科技4月10日动静,也是全球范畴内除Claude Opus 4.6外少数具备这一能力的模子。SWE-Bench Pro要求模子正在实正在GitHub仓库中定位并修复高难度工程Bug。GLM-5.1不只承继了上一代模子的开源SOTA编码能力,3月底智谱正式推出了GLM-5.1大模子,号称比全球最强的Opus 4.6只低了2.6分。正在METR榜单的划一评估尺度下,GLM-5.1刷新全球最佳成就,位列全球模子第三。实现了:前两天GLM-5.1大模子也正式开源,GLM-5.1大大提高了代码能力,也深受开辟者喜爱,此前智谱提到,按照智谱的说法,跨越GPT-5.4、Claude Opus 4.6。还正在长程使命(Long-Horizon Task)上取得冲破,正在完成长程使命方面提拔尤为显著。是权衡模子可否胜任专业软件开辟的最硬目标。编程能力评分45.3分。

上一篇:oken背后反映的是一个更大的趋向
下一篇:”对应“bit”


客户服务热线

0731-89729662

在线客服