LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云 火山引擎 通义大模型 DeepSeek AI 大模型 人工智能 MCP 智能体

2025-02-04 10:38:26 117人关注

智谱深度推理模型 GLM-Zero 预览版上线 擅长数理、代码等问题

在北京智谱华章科技有限公司的年度收官之际,公司发布了其首个基于扩展强化学习技术训练的推理模型——GLM-Zero的初代版本GLM-Zero-Preview。这款模型专注于提升人工智能的推理能力,尤其在数理逻辑、代码编写以及需要深度推理的复杂问题处理方面表现出色。与基座模型相比,GLM-Zero-Preview在保持通用任务能力的同时,专家任务能力得到了显著提升,其在AIME2024、MATH500和LiveCodeBench评测中的表现与OpenAI o1-preview相当。

GLM-Zero 大模型数学推理 大模型代码能力 GLM-Zero 技术解析 GLM-Zero 应用场景

2025-01-27 10:34:11 81人关注

讯飞星火4.0 Turbo七大核心能力升级:数学、代码能力超GPT-4o

今日,讯飞星火4.0Turbo迎来了全面升级,其七大核心能力——文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力,均实现了显著提升,并在数学和代码能力方面超越了性能强劲的GPT-4o。

讯飞星火4 Turbo AI大模型 数学能力提升 代码生成技术 GPT-4对比评测 AI模型性能分析

2025-01-16 09:16:37 58人关注

DeepSeek开源DeepSeek-V2-Chat-0628模型 代码、数学推理能力提升

近日,LMSYS组织的大模型竞技场(Chatbot Arena)发布了最新的榜单更新,LMSYS Chatbot Arena 排行榜上总排名11超过了所有开源模型,包括Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B等,荣获全球开源模型榜首的荣誉。

DeepSeek V2 Chat模型 代码能力 数学推理 大模型技术 DeepSeek模型更新

2025-01-05 11:16:37 478人关注

DeepSeek又更新!DeepSeek V2.5聊天模型代码能力飞跃,性能全面提升

在人工智能领域,DeepSeek的最新版本DeepSeek-V2.5以其卓越的代码编写能力和聊天模型性能,再次证明了其在技术前沿的地位。在与GPT-4的激烈对决中,DeepSeek-V2.5在多个测试集上展现了显著的胜率提升。

DeepSeek V2 DeepSeek V2聊天模型 DeepSeek V2代码性能 DeepSeek V2技术解析 DeepSeek V2模型评测

2024-12-20 22:37:36 111人关注

通义千问开源Qwen2.5-Coder全系列 代码能力追平 GPT-4o

通义千问团队近日宣布开源其最新的Qwen2.5-Coder全系列,这一举措旨在推动Open Code LLMs的发展。Qwen2.5-Coder以其强大、多样和实用性受到关注。Qwen2.5-Coder-32B-Instruct模型在代码能力上达到了SOTA水平,与GPT-4o相当,展现出全面的能力,包括代码生成、代码修复和代码推理。它在多个代码生成基准测试中取得了最佳表现,并在Aider基准测试中达到73.7分,与GPT-4o表现相当。

通义千问2.5代码能力 通义千问2.5代码模型 Qwen-2.5-Coder代码能力 GPT-4代码能力对比 AI代码模型评测

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10