- 上云资讯 -



2025-01-16 09:16:37 54人关注

DeepSeek开源DeepSeek-V2-Chat-0628模型 代码、数学推理能力提升

近日,LMSYS组织的大模型竞技场(Chatbot Arena)发布了最新的榜单更新,LMSYS Chatbot Arena 排行榜上总排名11超过了所有开源模型,包括Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B等,荣获全球开源模型榜首的荣誉。

2024-12-28 15:24:24 110人关注

苹果研究团队发布新基准GSM-Symbolic:揭示大语言模型的数学推理短板!

最近,苹果公司的研究人员对大语言模型(LLM)的数学推理能力进行了深入研究,推出了一项名为 GSM-Symbolic 的新基准测试。