上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-07-12 16:12:20 1070人关注

月之暗面Kimi K2 模型发布并开源擅长代码与 Agentic 任务

月之暗面公司正式发布了其最新力作——Kimi K2模型，并同步宣布开源。这款基于MoE架构的基础模型，凭借其强大的代码能力、卓越的通用Agent任务处理能力，一经发布便在AI领域引起了广泛关注。

Kimi K2模型 MoE架构基础模型开源AI模型代码能力AI模型通用Agent任务处理月之暗面公司AI技术

2025-02-04 10:38:26 308人关注

智谱深度推理模型 GLM-Zero 预览版上线擅长数理、代码等问题

在北京智谱华章科技有限公司的年度收官之际，公司发布了其首个基于扩展强化学习技术训练的推理模型——GLM-Zero的初代版本GLM-Zero-Preview。这款模型专注于提升人工智能的推理能力，尤其在数理逻辑、代码编写以及需要深度推理的复杂问题处理方面表现出色。与基座模型相比，GLM-Zero-Preview在保持通用任务能力的同时，专家任务能力得到了显著提升，其在AIME2024、MATH500和LiveCodeBench评测中的表现与OpenAI o1-preview相当。

GLM-Zero 大模型数学推理大模型代码能力 GLM-Zero 技术解析 GLM-Zero 应用场景

2025-01-27 10:34:11 236人关注

讯飞星火4.0 Turbo七大核心能力升级：数学、代码能力超GPT-4o

今日，讯飞星火4.0Turbo迎来了全面升级，其七大核心能力——文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力，均实现了显著提升，并在数学和代码能力方面超越了性能强劲的GPT-4o。

讯飞星火4 Turbo AI大模型数学能力提升代码生成技术 GPT-4对比评测 AI模型性能分析

2025-01-16 09:16:37 230人关注

DeepSeek开源DeepSeek-V2-Chat-0628模型代码、数学推理能力提升

近日，LMSYS组织的大模型竞技场（Chatbot Arena）发布了最新的榜单更新，LMSYS Chatbot Arena 排行榜上总排名11超过了所有开源模型，包括Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B等，荣获全球开源模型榜首的荣誉。

DeepSeek V2 Chat模型代码能力数学推理大模型技术 DeepSeek模型更新

2025-01-05 11:16:37 779人关注

DeepSeek又更新！DeepSeek V2.5聊天模型代码能力飞跃，性能全面提升

在人工智能领域，DeepSeek的最新版本DeepSeek-V2.5以其卓越的代码编写能力和聊天模型性能，再次证明了其在技术前沿的地位。在与GPT-4的激烈对决中，DeepSeek-V2.5在多个测试集上展现了显著的胜率提升。

DeepSeek V2 DeepSeek V2聊天模型 DeepSeek V2代码性能 DeepSeek V2技术解析 DeepSeek V2模型评测

2024-12-20 22:37:36 297人关注

通义千问开源Qwen2.5-Coder全系列代码能力追平 GPT-4o

通义千问团队近日宣布开源其最新的Qwen2.5-Coder全系列，这一举措旨在推动Open Code LLMs的发展。Qwen2.5-Coder以其强大、多样和实用性受到关注。Qwen2.5-Coder-32B-Instruct模型在代码能力上达到了SOTA水平，与GPT-4o相当，展现出全面的能力，包括代码生成、代码修复和代码推理。它在多个代码生成基准测试中取得了最佳表现，并在Aider基准测试中达到73.7分，与GPT-4o表现相当。

通义千问2.5代码能力通义千问2.5代码模型 Qwen-2.5-Coder代码能力 GPT-4代码能力对比 AI代码模型评测

- 上云资讯 -

月之暗面Kimi K2 模型发布并开源擅长代码与 Agentic 任务

智谱深度推理模型 GLM-Zero 预览版上线擅长数理、代码等问题

讯飞星火4.0 Turbo七大核心能力升级：数学、代码能力超GPT-4o

DeepSeek开源DeepSeek-V2-Chat-0628模型代码、数学推理能力提升

DeepSeek又更新！DeepSeek V2.5聊天模型代码能力飞跃，性能全面提升

通义千问开源Qwen2.5-Coder全系列代码能力追平 GPT-4o

推荐阅读

上云服务

- 上云资讯 -

月之暗面Kimi K2 模型发布并开源 擅长代码与 Agentic 任务

智谱深度推理模型 GLM-Zero 预览版上线 擅长数理、代码等问题

讯飞星火4.0 Turbo七大核心能力升级：数学、代码能力超GPT-4o

DeepSeek开源DeepSeek-V2-Chat-0628模型 代码、数学推理能力提升

DeepSeek又更新！DeepSeek V2.5聊天模型代码能力飞跃，性能全面提升

通义千问开源Qwen2.5-Coder全系列 代码能力追平 GPT-4o

推荐阅读

上云服务

月之暗面Kimi K2 模型发布并开源擅长代码与 Agentic 任务

智谱深度推理模型 GLM-Zero 预览版上线擅长数理、代码等问题

DeepSeek开源DeepSeek-V2-Chat-0628模型代码、数学推理能力提升

通义千问开源Qwen2.5-Coder全系列代码能力追平 GPT-4o