- 上云资讯 -
2025-04-30 16:39:12 181人关注
70亿参数干翻320亿?小米扔出“核弹级”AI MiMo 你的“破电脑”也能跑赢奥数题和复杂代码!
小米正式在Hugging Face平台发布其首个专为推理(Reasoning)设计的开源大模型——MiMo-7B。据AIbase了解,MiMo-7B通过从预训练到后训练的强化学习(RL)优化,展现了在数学、代码和通用推理任务上的卓越性能,超越了多个32亿参数以上的基线模型。社交平台上的热烈讨论凸显了其对AI社区的深远影响,相关细节已通过Hugging Face(huggingface.co/xiaomi/MiMo-7B)与小米官网(xiaomi.com)公开。
2025-04-06 16:37:19 45人关注
Meta 官宣开源原生多模态 Llama 4,性能强劲引关注
美国科技巨头 Meta 推出了其最强大的开源人工智能模型 Llama4。此次首批发布共两款,分别是 Llama4Scout 和 Llama4Maverick 。
2025-01-27 08:41:19 422人关注
MiniMax开源了MiniMax-01全新系列模型 性能比肩GPT-4o
MiniMax于2025年1月15日宣布开源其全新系列模型MiniMax-01,该系列包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax-01系列在架构上进行了大胆创新,首次大规模实现线性注意力机制,打破了传统Transformer架构的局限。其参数量高达4560亿,单次激活459亿,综合性能与海外顶尖模型相当,且能高效处理长达400万token的上下文,这一长度是GPT-4o的32倍、Claude-3.5-Sonnet的20倍。
2025-01-19 16:41:31 358人关注
OpenAI几周内发布 o3-mini,性能略逊于 o1-pro
近日,OpenAI 的 CEO 山姆・奥特曼在社交媒体上透露,备受期待的 o3-mini 将在几周内正式发布。这一消息让众多关注人工智能发展的用户感到兴奋。o3-mini 作为大模型的蒸馏版,将同时推出 API 和网页端,进一步满足用户的需求。
2025-01-17 05:21:16 89人关注
争气!Claude 3.5 Sonnet在数据可视化领域超越GPT-4o
AI领域的王者追逐十分激烈,据最新报道Anthropic公司推出的Claude3.5Sonnet模型在数据可视化方面表现出色,甚至超越了OpenAI的GPT-4o。这款全新的AI模型,不仅速度快,推理能力和创新功能也得到了极大的提升,成为行业的新标杆。
2025-01-15 19:21:45 114人关注
Meta推出开源大语言模型Llama 3.1 405B,性能堪比GPT-4
昨晚,Meta公司宣布开源其最新大语言模型Llama3.1 405B。这一重磅消息标志着经过一年的精心筹备,从项目规划到最终审核,Llama3系列模型终于与公众见面。
Meta Llama 3 GPT-4性能对比 Meta Llama 3 1.405B模型 大模型性能评测 AI模型技术进展
2025-01-13 10:24:11 285人关注
谷歌推超强多模态模型实验版Gemini 1.5 Pro,排名领先GPT-4o、 Claude-3.5 Sonnet
谷歌今天推出了其最新的人工智能力作——Gemini1.5Pro,并通过 Google AI Studio 和 Gemini API 提供了实验性的“版本0801”用于早期测试和反馈。
2025-01-05 20:24:11 137人关注
周鸿祎谈360安全大模型:安全能力方面已超越GPT-4
在2024年9月4日举行的第二届网络空间安全(天津)论坛上,360集团创始人周鸿祎发表了题为《打造安全大模型,用AI重塑安全》的演讲,分享了他对人工智能大模型时代下网络安全形势的见解,并介绍了360集团在该领域的实践和成果。
2025-01-04 21:31:21 69人关注
vivo全新蓝心大模型下月发布 涵盖多模态、端侧等多个领域
vivo的OS产品副总裁周围宣布,公司将在下个月的开发者大会上发布全新的蓝心大模型。这一新模型将涵盖语言、语音、视觉、多模态以及端侧等多个领域的大模型。