上云资讯 - 来上云吧，企业上云一站式服务

2025-01-18 06:33:33 257人关注

Llama 3超越GPT-4！英伟达推微调新框架RankRAG

最近，佐治亚理工学院和英伟达的两位华人学者提出了一种名为RankRAG的新型微调框架，这个框架极大简化了原本复杂的RAG流水线，使用微调方法让同一个LLM完成检索、排名和生成任务，结果还实现了性能的大幅提升。

Llama 3 GPT-4 大模型对比大模型性能评测 AI模型技术突破

2025-01-17 23:41:41 293人关注

超越Llama 3的性能怪兽：Falcon 2开源大模型，商用AI的新标杆

在AI领域，一股新的力量正在崛起。阿布扎比技术创新研究所（TII）宣布开源他们的全新大模型Falcon2，一个拥有110亿参数的模型，它以出色的性能和多语言能力，引起了全球的关注。

开源AI模型 Falcon 2开源AI 商业AI应用开源AI技术 Falcon 2商业许可 AI模型开源

2025-01-17 08:41:40 241人关注

开源多模态巨兽登场！Meta将于7月23日推出Llama 3 405B模型

Meta又要搞大事情了!他们即将推出一款名为Llama3405B的开源语言模型，这不仅是他们迄今为止最大的模型，而且还是史上最大的开源语言模型。这个巨无霸，拥有惊人的4050亿参数，能在图像和文本之间自如穿梭，彻底颠覆了以往只能处理文本的老黄历。

Meta Llama3 405B 大模型发布 AI大模型技术 Meta Llama3 应用场景大模型技术原理

2025-01-16 00:36:14 342人关注

震惊AI界！Llama 3.1泄露：4050亿参数的开源巨兽来袭！

Llama3.1泄露了!你没听错，这个拥有4050亿参数的开源模型，已经在Reddit上引起了轩然大波。这可能是迄今为止最接近GPT-4o的开源模型，甚至在某些方面超越了它。

Llama 3 1泄露 4050亿参数模型 Llama 3泄露细节大模型参数规模大模型技术新闻

2025-01-15 19:28:32 253人关注

扎克伯格：Llama 3.1有望成为开源AI的Linux

Meta公司首席执行官马克·扎克伯格近日宣布了Llama3.1的正式发布，并表示这可能是开源AI领域的一个重要里程碑。

扎克伯格 LLaMA 3 开源AI Linux AI大模型开源大模型

2025-01-15 19:21:45 327人关注

Meta推出开源大语言模型Llama 3.1 405B，性能堪比GPT-4

昨晚，Meta公司宣布开源其最新大语言模型Llama3.1 405B。这一重磅消息标志着经过一年的精心筹备，从项目规划到最终审核，Llama3系列模型终于与公众见面。

Meta Llama 3 GPT-4性能对比 Meta Llama 3 1.405B模型大模型性能评测 AI模型技术进展

2025-01-15 18:12:21 291人关注

Meta最新AI模型Llama 3.1登陆Cloudflare Workers AI平台

Cloudflare近日宣布，作为Meta公司的首批合作伙伴之一，他们已在Workers AI平台上线了Meta最新发布的Llama3.18B模型。这一举措使得开发者能够在模型发布的第一天就开始使用这一先进的AI工具。

Meta AI Llama 3 Cloudflare Workers 大模型技术 AI 大模型应用云端AI部署

2025-01-15 12:35:20 242人关注

亚马逊云：Llama 3.1系列模型已在 Amazon Bedrock 可用

亚马逊云科技宣布在Amazon Bedrock上提供Llama3.1模型，这是Meta开发的先进、强大的AI模型系列。Llama3.1模型包含8B、70B和405B三种参数量的模型，它们在广泛的行业基准测试中展现了最先进的性能，并为生成式AI应用程序提供新功能。

Amazon Cloud LLaMA 3-1模型 Bedrock平台大模型托管云服务AI模型

2025-01-15 07:36:19 215人关注

Meta AI 研究员：网络上的文本都是“垃圾” Llama 3全是合成数据

Meta AI的研究员Thomas Scialom最近在一次采访中分享了一些关于他们最新项目Llama3的见解。他直言不讳地指出，网络上的大量文本质量参差不齐，他认为在这些数据上进行训练是一种资源浪费。因此，Llama3的训练过程中并没有依赖任何人类编写的答案，而是完全基于Llama2生成的合成数据。

Meta AI LLaMA 3 合成数据 AI研究员大模型训练数据

2025-01-14 16:34:22 539人关注

Llama 4启动训练 Meta科学家揭秘Llama 3.1训练背后的故事

Meta的科学家Thomas Scialom在播客节目Latent Space中，为我们揭开了Llama3.1的研发秘籍，并提前透露了Llama4的神秘面纱。

Llama 4 LLaMA 3 大模型训练技术 AI模型训练方法 LLaMA系列模型发展

2025-01-14 13:22:18 263人关注

Llama 3.1训练故障频发：1.6万块H100每3小时故障1次 GPU和HBM3显存是关键！

在人工智能的世界里，每一次突破都伴随着令人瞠目结舌的数据。想象一下，16384块GPU同时运转，这不是科幻电影里的场景，而是Meta公司在训练最新Llama3.1模型时的真实写照。然而，在这场技术盛宴的背后，隐藏着平均每3小时就会发生一次的故障。这个惊人的数字，不仅展示了AI发展的速度，也暴露了当前技术面临的巨大挑战。

Llama 3 AI模型训练失败案例 H100 GPU性能分析 HBM3内存技术大模型训练挑战

2025-01-13 11:11:11 501人关注

扎克伯格表示，训练Llama 4所需的算力将比Llama 3高10倍

Meta 作为大型开源基础语言模型 Llama 的开发者，认为未来训练模型所需的计算力将大幅增加。

扎克伯格 LLaMA4 LLaMA3 10倍算力提升 AI大模型算力需求

2025-01-13 03:19:32 342人关注

大模型瘦身专家！单卡处理Llama 3.1 405B 超强压缩工具LLMC来了

人工智能（AI）正变得越来越聪明，尤其是那些大型语言模型(LLMs)，它们在处理自然语言方面的能力让人惊叹。但你知道吗?这些聪明的AI大脑背后，是需要巨大的计算力和存储空间来支撑的。

Llama 3 大模型压缩工具 405B模型压缩大模型优化技术模型压缩实践

2025-01-11 04:27:12 250人关注

礼貌AI遇上“癫公”？Claude差点被Llama 3整自闭了！

在人工智能的神秘领域，一场前所未有的"安全词模拟实验"在X上的人类监督者记录下拉开了帷幕。Llama3.1405B和Claude3超大杯Opus，两个AI被置于封闭环境中，展开了一场充满挑战与未知的对话。

礼貌AI Claude LLaMA3 AI大模型大模型技术

2025-01-09 22:42:17 337人关注

小而强悍！10人团队炼出首个微调Llama 3.1 405B

一个仅有10人的小团队，竟然敢挑战科技巨头Meta的地位，这简直就是现实版的"大卫战胜歌利亚"!

小团队微调Llama 3 10人团队微调大模型 Llama 3微调实践小团队高效微调技巧低成本微调大模型方法

2025-01-09 07:32:13 341人关注

Llama3压缩版！Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数

在如今科技公司纷纷追逐在设备上实现人工智能的时代，越来越多的小型语言模型（SLM）应运而生，能够在资源受限的设备上运行。最近，Nvidia 的研究团队利用前沿的模型剪枝和蒸馏技术，推出了 Llama-3.1-Minitron4B，这是 Llama3模型的压缩版本。这个新模型在性能上不仅可以与更大的模型媲美，还能与同等规模的小型模型竞争，同时在训练和部署上都显得更加高效。

Llama3 Mini Llama 3 Minitron 4b 大模型技术大模型技术原理

2025-01-08 00:13:34 259人关注

Llama 3遇冷！企业更偏爱Claude等闭源模型

Meta 推出的开源大模型 Llama3似乎在市场上遭遇了 “冷处理”，这一现象无疑让开源与闭源大模型的竞争愈加激烈。据外媒The Information报道，全球最大的云计算平台亚马逊 AWS 对 Llama3的反响平平，相反，企业客户们似乎更青睐 Anthropic 的闭源模型 Claude。

llama-3 冷偏好技术 Claude 大模型偏好优化 LLM技术进展

2025-01-05 13:14:42 464人关注

Llama3天瘦成Mamba！推理速度提升1.5倍

最近，Mamba 团队的研究令人瞩目:来自康奈尔和普林斯顿等高校的研究者们成功将 Llama 这一大型 Transformer 模型 “蒸馏” 成了 Mamba，并设计了一种新型的推理解码算法，显著提高了模型的推理速度。

Llama 3 Mamba 推理速度优化大模型推理加速 LLM性能提升

2024-12-25 18:10:43 232人关注

法国AI创企Les Ministraux发布全新轻量级模型，性能超越Llama 3！

法国AI初创公司Les Ministraux 推出两款全新轻量级模型Ministral3B和Ministral8B，专为边缘设备设计，参数分别为30亿和80亿。这两款模型在指令跟随基准测试中表现出色，Ministral3B超越了Llama38B和Mistral7B，Ministral8B则在除代码能力外其他方面均优于这两个模型。

法国AI初创公司轻量级模型 LLaMA3 AI模型性能对比 AI初创公司技术突破

2024-12-25 03:24:43 303人关注

Meta AI新量化版本Llama 3.2：速度提高2倍、体量减少56%，手机就能运行

最近，Meta AI 推出了全新的量化 Llama3.2模型，包含1B 和3B 两个版本，这款模型可以在多种设备上进行微调、蒸馏和部署。

Meta AI Llama 3 AI大模型大模型优化技术移动端AI加速模型性能提升

- 上云资讯 -