- 上云资讯 -
2025-04-18 16:32:40 114人关注
AI 基准测试平台 Chatbot Arena 成立一家新公司
在 AI 行业快速发展的背景下,Chatbot Arena 这个众包 AI 基准测试项目正在扩展其影响力,正式成立了一家名为 Arena Intelligence Inc. 的新公司。根据彭博社的报道,Chatbot Arena 旨在通过这家新公司获取更多资源,从而显著改善其平台的功能和服务。
2025-02-04 16:21:22 317人关注
微软正式开源超强小模型Phi-4 性能测试超越GPT-4o、Llama-3.1
微软近期在 Hugging Face 平台上发布了名为 Phi-4的小型语言模型,这款模型的参数量仅为140亿,但在多项性能测试中表现出色,超越了众多知名模型,包括 OpenAI 的 GPT-4o 及其他同类开源模型如 Qwen2.5和 Llama-3.1。
2025-01-24 22:12:45 474人关注
挑战开源AI新高度:DeepSeek V3超越Llama3.1,训练数据达14.8万亿token
中国人工智能公司DeepSeek日前发布了一款具有里程碑意义的开源大语言模型DeepSeek V3。这款拥有6710亿参数的模型不仅规模超越Meta的Llama3.1,在多项基准测试中的表现也优于包括GPT-4在内的主流封闭源模型。
2025-01-20 02:28:19 69人关注
Arcee Spark:以Qwen2 为基础的模型在多项任务上超越 GPT-3.5
近日,一款以Qwen2为基础的模型 Arcee Spark ,在180万个样本数据上进行了微调,具有128k token上下文。 Arcee Spark 的发布,引起了广泛的关注,尤其是在人工智能领域的从业者中,更是引发了一股热潮。
2025-01-13 17:26:35 69人关注
谷歌发布全新Gemma 2 2B模型,性能超越GPT-3.5-Turbo与Mixtral-8x7B
谷歌正式推出了其 Gemma2系列的新成员 ——Gemma22B 模型。这个拥有20亿参数的模型,展现出了在多种硬件环境下的卓越性能。除了强大的模型本身,谷歌还推出了 ShieldGemma 安全分类器,以过滤有害内容,并提供 Gemma Scope 工具,供研究人员分析模型的决策过程。
2025-01-05 08:41:11 127人关注
性能超越GPT-4o 和 Claude 3.5 Sonnet!超强的Reflection 70B 模型登场
人工智能初创公司HyperWrite的首席执行官Matt Shumer宣布了一个重要的里程碑:他们推出了基于Meta开源Llama3.1-70B Instruct的Reflection70B模型。这款新模型不仅在第三方基准测试中表现卓越,还被誉为“世界上最强大的开源AI模型”。