- 上云资讯 -
2025-01-17 23:41:41 69人关注
超越Llama 3的性能怪兽:Falcon 2开源大模型,商用AI的新标杆
在AI领域,一股新的力量正在崛起。阿布扎比技术创新研究所(TII)宣布开源他们的全新大模型Falcon2,一个拥有110亿参数的模型,它以出色的性能和多语言能力,引起了全球的关注。
2025-01-17 08:41:40 33人关注
开源多模态巨兽登场!Meta将于7月23日推出Llama 3 405B模型
Meta又要搞大事情了!他们即将推出一款名为Llama3405B的开源语言模型,这不仅是他们迄今为止最大的模型,而且还是史上最大的开源语言模型。这个巨无霸,拥有惊人的4050亿参数,能在图像和文本之间自如穿梭,彻底颠覆了以往只能处理文本的老黄历。
2025-01-16 00:36:14 91人关注
震惊AI界!Llama 3.1泄露:4050亿参数的开源巨兽来袭!
Llama3.1泄露了!你没听错,这个拥有4050亿参数的开源模型,已经在Reddit上引起了轩然大波。这可能是迄今为止最接近GPT-4o的开源模型,甚至在某些方面超越了它。
2025-01-15 19:21:45 114人关注
Meta推出开源大语言模型Llama 3.1 405B,性能堪比GPT-4
昨晚,Meta公司宣布开源其最新大语言模型Llama3.1 405B。这一重磅消息标志着经过一年的精心筹备,从项目规划到最终审核,Llama3系列模型终于与公众见面。
Meta Llama 3 GPT-4性能对比 Meta Llama 3 1.405B模型 大模型性能评测 AI模型技术进展
2025-01-15 18:12:21 90人关注
Meta最新AI模型Llama 3.1登陆Cloudflare Workers AI平台
Cloudflare近日宣布,作为Meta公司的首批合作伙伴之一,他们已在Workers AI平台上线了Meta最新发布的Llama3.18B模型。这一举措使得开发者能够在模型发布的第一天就开始使用这一先进的AI工具。
2025-01-15 12:35:20 60人关注
亚马逊云:Llama 3.1系列模型已在 Amazon Bedrock 可用
亚马逊云科技宣布在Amazon Bedrock上提供Llama3.1模型,这是Meta开发的先进、强大的AI模型系列。Llama3.1模型包含8B、70B和405B三种参数量的模型,它们在广泛的行业基准测试中展现了最先进的性能,并为生成式AI应用程序提供新功能。
2025-01-14 16:34:22 242人关注
Llama 4启动训练 Meta科学家揭秘Llama 3.1训练背后的故事
Meta的科学家Thomas Scialom在播客节目Latent Space中,为我们揭开了Llama3.1的研发秘籍,并提前透露了Llama4的神秘面纱。
2025-01-14 13:22:18 52人关注
Llama 3.1训练故障频发:1.6万块H100每3小时故障1次 GPU和HBM3显存是关键!
在人工智能的世界里,每一次突破都伴随着令人瞠目结舌的数据。想象一下,16384块GPU同时运转,这不是科幻电影里的场景,而是Meta公司在训练最新Llama3.1模型时的真实写照。然而,在这场技术盛宴的背后,隐藏着平均每3小时就会发生一次的故障。这个惊人的数字,不仅展示了AI发展的速度,也暴露了当前技术面临的巨大挑战。
2025-01-09 22:42:17 107人关注
小而强悍!10人团队炼出首个微调Llama 3.1 405B
一个仅有10人的小团队,竟然敢挑战科技巨头Meta的地位,这简直就是现实版的"大卫战胜歌利亚"!
2025-01-09 07:32:13 100人关注
Llama3压缩版!Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数
在如今科技公司纷纷追逐在设备上实现人工智能的时代,越来越多的小型语言模型(SLM)应运而生,能够在资源受限的设备上运行。最近,Nvidia 的研究团队利用前沿的模型剪枝和蒸馏技术,推出了 Llama-3.1-Minitron4B,这是 Llama3模型的压缩版本。这个新模型在性能上不仅可以与更大的模型媲美,还能与同等规模的小型模型竞争,同时在训练和部署上都显得更加高效。
2024-12-25 18:10:43 28人关注
法国AI创企Les Ministraux发布全新轻量级模型,性能超越Llama 3!
法国AI初创公司Les Ministraux 推出两款全新轻量级模型Ministral3B和Ministral8B,专为边缘设备设计,参数分别为30亿和80亿。这两款模型在指令跟随基准测试中表现出色,Ministral3B超越了Llama38B和Mistral7B,Ministral8B则在除代码能力外其他方面均优于这两个模型。
2024-12-25 03:24:43 47人关注
Meta AI新量化版本Llama 3.2:速度提高2倍、体量减少56%,手机就能运行
最近,Meta AI 推出了全新的量化 Llama3.2模型,包含1B 和3B 两个版本,这款模型可以在多种设备上进行微调、蒸馏和部署。