LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-05-03 16:33:40 77人关注

64页论文揭示AI模型排行榜黑幕:Llama4发布前私下测试27个版本,只取最佳成绩

近日,一篇名为《排行榜幻觉》的论文在学术界引发了广泛关注,尤其是对大型语言模型(LLM)领域中备受推崇的 Chatbot Arena 排行榜提出了严厉质疑。研究指出,排行榜的可信度因数据访问不平等、模型私下测试等问题而受到挑战。

AI模型排名 LLAMA4测试 64页AI论文 大模型评估 AI模型性能对比

2025-04-07 10:31:39 89人关注

Meta被指AI模型"双标":评测版与公开版Maverick表现大相径庭

Meta周六发布了其新旗舰AI模型Maverick,该模型在LM Arena评测中排名第二。LM Arena是一项依靠人类评分者比较不同模型输出并选择偏好的测试平台。然而,多位AI研究人员很快发现,Meta部署到LM Arena的Maverick版本似乎与开发人员广泛使用的版本存在显著差异。

Meta AI模型 Maverick性能差异 AI模型性能对比 Meta AI技术解析 大模型性能优化

2025-04-03 16:15:26 309人关注

Gemini-2.5-pro在MathArena评测中展现卓越数学能力 远超其他模型

2025年4月3日消息:根据MathArena最新发布的大语言模型数学能力评测结果显示,Google的Gemini-2.5-pro以绝对优势领跑,在未污染的高难度数学竞赛中展现出令人瞩目的表现。

Gemini 2.5 Pro Matharena AI性能评测 大模型数学能力 AI模型性能对比

2024-12-31 21:23:12 225人关注

​全新开源 AI 模型 Molmo 横扫业界巨头,超越 GPT-4o 与 Claude 3.5

近日,艾伦人工智能研究所(Ai2)发布了 Molmo,这是一个全新的开源多模 AI 模型家族,表现出色,甚至在多个第三方基准测试中超越了 OpenAI 的 GPT-4o、Anthropic 的 Claude3.5Sonnet 和谷歌的 Gemini1.5。

开源AI模型 Molmo GPT4o Claude35 AI模型性能对比 开源模型评测

2024-12-27 08:43:41 79人关注

英伟达发布了个70B的新AI模型,碾压GPT-4和Claude3.5

Nvidia 悄然推出了一款新型人工智能模型,名为 Llama-3.1-Nemotron-70B-Instruct,表现出色,已经超越了 OpenAI 的 GPT-4和 Anthropic 的 Claude3.5,标志着人工智能领域竞争格局的重大变化。这款模型在知名 AI 平台 Hugging Face 上发布,虽然没有太大的宣传,但其卓越的性能迅速引起了业界的关注。

NVIDIA 70B AI模型 AI模型性能对比 GPT4性能对比 Claude3性能对比 大模型技术突破

2024-12-25 18:10:43 64人关注

法国AI创企Les Ministraux发布全新轻量级模型,性能超越Llama 3!

法国AI初创公司Les Ministraux 推出两款全新轻量级模型Ministral3B和Ministral8B,专为边缘设备设计,参数分别为30亿和80亿。这两款模型在指令跟随基准测试中表现出色,Ministral3B超越了Llama38B和Mistral7B,Ministral8B则在除代码能力外其他方面均优于这两个模型。

法国AI初创公司 轻量级模型 LLaMA3 AI模型性能对比 AI初创公司技术突破

2024-12-24 10:24:33 71人关注

生图能力超越Flux1.1 Pro!神秘AI模型"红熊猫"Red_panda横空出世

近日,一款代号"red_panda"的神秘AI图像生成模型在众包分析平台Artificial Analysis的基准测试中取得惊人成绩,以显著优势超越了Midjourney、Black Forest Labs和OpenAI等行业领军企业的产品。

红熊猫AI模型 Flux1-1 Pro超越 AI模型性能对比 AI模型评测 红熊猫AI技术突破

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10