- 上云资讯 -
2025-01-27 08:41:19 422人关注
MiniMax开源了MiniMax-01全新系列模型 性能比肩GPT-4o
MiniMax于2025年1月15日宣布开源其全新系列模型MiniMax-01,该系列包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax-01系列在架构上进行了大胆创新,首次大规模实现线性注意力机制,打破了传统Transformer架构的局限。其参数量高达4560亿,单次激活459亿,综合性能与海外顶尖模型相当,且能高效处理长达400万token的上下文,这一长度是GPT-4o的32倍、Claude-3.5-Sonnet的20倍。
2025-01-15 19:21:45 114人关注
Meta推出开源大语言模型Llama 3.1 405B,性能堪比GPT-4
昨晚,Meta公司宣布开源其最新大语言模型Llama3.1 405B。这一重磅消息标志着经过一年的精心筹备,从项目规划到最终审核,Llama3系列模型终于与公众见面。
Meta Llama 3 GPT-4性能对比 Meta Llama 3 1.405B模型 大模型性能评测 AI模型技术进展