- 上云资讯 -
2025-05-04 16:33:25 197人关注
阿里Qwen3-235B-A22B模型正式登陆HuggingChat
由阿里巴巴云开发的 Qwen3-235B-A22B 模型正式在 HuggingChat 平台上线。这一开源大型语言模型以其强大的推理能力、灵活的模式切换和高效的性能表现,迅速成为业界关注的焦点。AIbase 通过整理 Twitter 上的最新信息,为您深入解析 Qwen3-235B-A22B 的技术亮点及其对开源 AI 生态的影响。
2025-01-28 10:44:35 267人关注
国产开源大模型 DeepSeek R1 发布,性能超越o1模、成本降90%
正文:近期,中国的 DeepSeek 团队重磅推出了其最新开源大模型 R1,受到了广泛关注。R1模型的性能表现极其出色,在多项测试中均超越了 OpenAI 的 o1模型,尤其是在数学和编程方面的评估中表现优异。
2025-01-24 01:20:26 72人关注
IBM发布更新版Granite 3.1开源语言模型,性能大幅提升
近日,IBM 宣布推出其开源语言模型 Granite 的3.1版本,此次更新带来了诸多重要改进。新版本的模型经过重新设计,采用了更加密集的架构,能够一次处理多达128,000个令牌。这一更新意味着 Granite 在处理复杂文本和任务时的能力得到了显著增强。
2025-01-19 08:18:45 54人关注
对标GPT-4o!开源大模型Moshi震撼登场:无区域限制,手机兼容
法国开源AI研究实验室Kyutai发布了一款全新的多模态大模型Moshi。这不仅仅是一个技术突破,更是对现有AI技术的一次大胆挑战。
2025-01-18 20:40:27 80人关注
截然相反!李彦宏称开源模型是智商税,阿里云CTO支持开源大模型
在最近举行的世界人工智能大会上,百度创始人李彦宏和阿里云CTO周靖人就开源模型的重要性发表了不同的看法。
2025-01-18 02:13:19 155人关注
全球首个芯片设计开源大模型SemiKong正式发布 性能超越通用大模型
全球首个芯片设计开源大模型SemiKong正式发布,它基于Llama3微调而来,性能超越了通用大模型。这不仅是技术的突破,更是开源精神的胜利,预示着未来五年内,5000亿美元的半导体行业将迎来翻天覆地的变化。
2025-01-17 23:41:41 68人关注
超越Llama 3的性能怪兽:Falcon 2开源大模型,商用AI的新标杆
在AI领域,一股新的力量正在崛起。阿布扎比技术创新研究所(TII)宣布开源他们的全新大模型Falcon2,一个拥有110亿参数的模型,它以出色的性能和多语言能力,引起了全球的关注。
2025-01-06 09:38:41 33人关注
游戏场景的智能助手来了!开源大模型 VideoGameBunny 让你玩得更嗨
在游戏开发的世界里,大模型正逐渐成为了无可替代的 “智囊团”,从生成 AI 角色到场景构建,几乎无所不包。
2025-01-03 21:13:40 75人关注
元象发布MoE开源大模型XVERSE-MoE-A36B 激活参数达36B
深圳元象信息科技有限公司近日宣布,公司已成功发布中国最大的Mixture of Experts(MoE)开源大模型——XVERSE-MoE-A36B。这款模型的发布标志着中国在AI领域的一大进步,将国产开源技术提升至国际领先水平。