上云资讯 - 来上云吧，企业上云一站式服务

2025-02-04 16:21:22 514人关注

微软正式开源超强小模型Phi-4 性能测试超越GPT-4o、Llama-3.1

微软近期在 Hugging Face 平台上发布了名为 Phi-4的小型语言模型，这款模型的参数量仅为140亿，但在多项性能测试中表现出色，超越了众多知名模型，包括 OpenAI 的 GPT-4o 及其他同类开源模型如 Qwen2.5和 Llama-3.1。

Microsoft Phi4 GPT4o LLaMA31 大模型性能对比 AI模型评测

2025-01-24 22:12:45 696人关注

挑战开源AI新高度:DeepSeek V3超越Llama3.1，训练数据达14.8万亿token

中国人工智能公司DeepSeek日前发布了一款具有里程碑意义的开源大语言模型DeepSeek V3。这款拥有6710亿参数的模型不仅规模超越Meta的Llama3.1，在多项基准测试中的表现也优于包括GPT-4在内的主流封闭源模型。

DeepSeek V3 LLaMA3 14万亿tokens 大模型性能对比 AI模型评测

2025-01-18 08:27:45 304人关注

aiOS：第一个基于Mistral7B模型的去中心化AI网络支持Llama-3

aiOS是 "hyperspaceai" 组织开发的世界首个基于 Mistral7B 模型的去中心化 AI 网络。它旨在彻底改变人工智能的可访问性，让用户能够体验到前沿的去中心化人工智能计算。目前该应用程序处于早期开发阶段，提供给 Windows、Linux 和 macOS 用户下载体验。目前已经支持Llama-3，用户可以免费体验。

Mistral7B 去中心化AI网络 LLaMA3 AI大模型技术开源AI框架

2025-01-17 08:41:40 239人关注

开源多模态巨兽登场！Meta将于7月23日推出Llama 3 405B模型

Meta又要搞大事情了!他们即将推出一款名为Llama3405B的开源语言模型，这不仅是他们迄今为止最大的模型，而且还是史上最大的开源语言模型。这个巨无霸，拥有惊人的4050亿参数，能在图像和文本之间自如穿梭，彻底颠覆了以往只能处理文本的老黄历。

Meta Llama3 405B 大模型发布 AI大模型技术 Meta Llama3 应用场景大模型技术原理

2025-01-15 18:14:24 338人关注

最强开源模型来了！Llama3.1以405B参数领先GPT-4o

在人工智能的世界里，开源与闭源的较量从未停歇。而今，Meta AI的Llama3.1模型的发布，似乎为这场较量画上了分水岭。这不仅仅是一个模型的发布，更是开源AI走向成熟的标志，预示着一个全新的时代即将到来。

开源大模型 LLaMA3模型 405B参数模型最佳开源模型开源AI技术

2025-01-15 10:13:41 361人关注

OpenBuddy开源大语言模型团队发布Llama3.1-8B模型中文版

Meta最近发布了新一代开源模型系列Llama3.1，其中包括一个405B参数的版本，其性能接近甚至在某些基准测试中超越了GPT-4等闭源模型。Llama3.1-8B-Instruct是该系列中的一个8B参数版本，支持英语、德语、法语、意大利语、葡萄牙语、西班牙语、印地语和泰语，上下文长度高达131072tokens，知识截止日期更新至2023年12月。

OpenBuddy Llama3 中文大模型 1.8B参数模型开源大模型中文LLM

2025-01-15 09:16:34 508人关注

神仙打架！Mistral Large2突然开源：1230亿个参数、媲美Llama3.1

继昨天Meta宣布发布最强开源模型Llama3.1之后，Mistral AI在今天凌晨隆重推出了其旗舰模型 Mistral Large2，这一新产品有 1230亿个参数，拥有超大的128k 上下文窗口，与从这方面来看可以媲美Llama3.1。

Mistral-Large2 开源大模型 1230亿参数 Mistral模型技术开源AI模型应用

2025-01-15 08:26:40 234人关注

Nvidia AI推ChatQA2:基于Llama3模型，长文本理解和RAG能力媲美GPT-4

在人工智能的快速发展中，长文本上下文理解和检索增强生成（RAG）的能力变得至关重要。Nvidia AI 的最新研究——ChatQA2模型，正是为了应对这一挑战而生。基于强大的Llama3模型，ChatQA2在处理大量文本输入和提供精确、高效的响应方面取得了显著进步。

NVIDIA AI ChatQA2 Llama3 RAG 大模型技术 AI聊天问答系统

2025-01-13 11:11:11 501人关注

扎克伯格表示，训练Llama 4所需的算力将比Llama 3高10倍

Meta 作为大型开源基础语言模型 Llama 的开发者，认为未来训练模型所需的计算力将大幅增加。

扎克伯格 LLaMA4 LLaMA3 10倍算力提升 AI大模型算力需求

2025-01-11 18:41:35 392人关注

解决Llama3训练困境！豆包大模型携手港大团队推全新检查点系统优化训练效率

在一个由数据和算法主导的数字世界里，人工智能的每一步成长都离不开一个关键元素——检查点（Checkpoint）。想象一下，当你正在训练一个能读懂人心、对答如流的大型语言模型时，这个模型聪明绝顶，但也是个"大胃王"，需要海量计算资源来"喂饱"它。在训练过程中，如果突然断电或硬件故障，损失将是巨大的。这时，检查点就像一台"时光机"，能让一切回到上一个安全状态，继续未完成的任务。

Llama3 训练检查点系统大模型训练技术模型训练优化 LLM训练方法 AI模型检查点机制

2025-01-11 04:27:12 250人关注

礼貌AI遇上“癫公”？Claude差点被Llama 3整自闭了！

在人工智能的神秘领域，一场前所未有的"安全词模拟实验"在X上的人类监督者记录下拉开了帷幕。Llama3.1405B和Claude3超大杯Opus，两个AI被置于封闭环境中，展开了一场充满挑战与未知的对话。

礼貌AI Claude LLaMA3 AI大模型大模型技术

2025-01-09 07:32:13 341人关注

Llama3压缩版！Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数

在如今科技公司纷纷追逐在设备上实现人工智能的时代，越来越多的小型语言模型（SLM）应运而生，能够在资源受限的设备上运行。最近，Nvidia 的研究团队利用前沿的模型剪枝和蒸馏技术，推出了 Llama-3.1-Minitron4B，这是 Llama3模型的压缩版本。这个新模型在性能上不仅可以与更大的模型媲美，还能与同等规模的小型模型竞争，同时在训练和部署上都显得更加高效。

Llama3 Mini Llama 3 Minitron 4b 大模型技术大模型技术原理

2025-01-05 13:14:42 463人关注

Llama3天瘦成Mamba！推理速度提升1.5倍

最近，Mamba 团队的研究令人瞩目:来自康奈尔和普林斯顿等高校的研究者们成功将 Llama 这一大型 Transformer 模型 “蒸馏” 成了 Mamba，并设计了一种新型的推理解码算法，显著提高了模型的推理速度。

Llama 3 Mamba 推理速度优化大模型推理加速 LLM性能提升

2025-01-01 03:28:24 285人关注

猛了！Meta震撼发布Llama3.2 视觉方面吊打所有闭源模型？

Meta 在其年度 Meta Connect2024大会上发布了 Llama3.2，旨在提升边缘 AI 和视觉任务的能力。

Meta Llama3 LLaMA3 2B模型 LLaMA3视觉模型 Meta AI大模型 LLaMA3技术解析

2024-12-31 09:27:41 296人关注

谷与Meta 齐发力!Llama3.2、更新Gemini 、AlphaChip 等各个都是重头戏

最近一周，AI 行业真是热闹非凡，谷歌和 Meta 都在推出新版本的 AI 模型，吸引了不少关注。首先，谷歌在周二宣布了其 Gemini 系列的新更新，推出了两个新的生产就绪模型 ——Gemini-1.5-Pro-002和 Gemini-1.5-Flash-002。

Meta Llama3 Gemini AlphaChip AI大模型大模型技术对比芯片技术发展

2024-12-31 04:15:24 336人关注

Salesforce AI 推全新大语言模型评估家族SFR-Judge 基于Llama3构建

在自然语言处理领域，大型语言模型（LLMs）的发展迅速，已经在多个领域取得了显著的进展。不过，随着模型的复杂性增加，如何准确评估它们的输出就变得至关重要。传统上，我们依赖人类来进行评估，但这种方式既耗时又难以规模化，无法跟上模型快速发展的步伐。

Salesforce AI SFR Judge Llama3 AI大模型 AI技术应用 Salesforce AI新闻

2024-12-25 18:10:43 230人关注

法国AI创企Les Ministraux发布全新轻量级模型，性能超越Llama 3！

法国AI初创公司Les Ministraux 推出两款全新轻量级模型Ministral3B和Ministral8B，专为边缘设备设计，参数分别为30亿和80亿。这两款模型在指令跟随基准测试中表现出色，Ministral3B超越了Llama38B和Mistral7B，Ministral8B则在除代码能力外其他方面均优于这两个模型。

法国AI初创公司轻量级模型 LLaMA3 AI模型性能对比 AI初创公司技术突破

2024-12-11 07:24:45 243人关注

Meta推出Llama3.370B:新一代AI模型性能超越GPT-4和Gemini1.5Pro

Meta近日宣布，推出其Llama系列的最新成员——Llama3.370B。Meta的生成式AI副总裁Ahmad Al-Dahle在X平台上发布了这一消息，并指出，Llama3.370B在性能上相较于Meta之前最大的Llama模型Llama3.1405B取得了显著进步，同时成本大幅降低。

Meta Llama3 370B AI大模型 Meta Llama3技术解析大模型技术原理 AI模型应用场景

- 上云资讯 -

微软正式开源超强小模型Phi-4 性能测试超越GPT-4o、Llama-3.1

挑战开源AI新高度:DeepSeek V3超越Llama3.1，训练数据达14.8万亿token

aiOS：第一个基于Mistral7B模型的去中心化AI网络支持Llama-3

开源多模态巨兽登场！Meta将于7月23日推出Llama 3 405B模型

最强开源模型来了！Llama3.1以405B参数领先GPT-4o

OpenBuddy开源大语言模型团队发布Llama3.1-8B模型中文版

神仙打架！Mistral Large2突然开源：1230亿个参数、媲美Llama3.1

Nvidia AI推ChatQA2:基于Llama3模型，长文本理解和RAG能力媲美GPT-4

扎克伯格表示，训练Llama 4所需的算力将比Llama 3高10倍

解决Llama3训练困境！豆包大模型携手港大团队推全新检查点系统优化训练效率

礼貌AI遇上“癫公”？Claude差点被Llama 3整自闭了！

Llama3压缩版！Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数

Llama3天瘦成Mamba！推理速度提升1.5倍

猛了！Meta震撼发布Llama3.2 视觉方面吊打所有闭源模型？

谷与Meta 齐发力!Llama3.2、更新Gemini 、AlphaChip 等各个都是重头戏

Salesforce AI 推全新大语言模型评估家族SFR-Judge 基于Llama3构建

法国AI创企Les Ministraux发布全新轻量级模型，性能超越Llama 3！

Meta推出Llama3.370B:新一代AI模型性能超越GPT-4和Gemini1.5Pro

推荐阅读

上云服务

- 上云资讯 -

微软正式开源超强小模型Phi-4 性能测试超越GPT-4o、Llama-3.1

挑战开源AI新高度:DeepSeek V3超越Llama3.1，训练数据达14.8万亿token

aiOS：第一个基于Mistral7B模型的去中心化AI网络 支持Llama-3

开源多模态巨兽登场！Meta将于7月23日推出Llama 3 405B模型

最强开源模型来了！Llama3.1以405B参数领先GPT-4o

OpenBuddy开源大语言模型团队发布Llama3.1-8B模型中文版

神仙打架！Mistral Large2突然开源：1230亿个参数、媲美Llama3.1

Nvidia AI推ChatQA2:基于Llama3模型，长文本理解和RAG能力媲美GPT-4

扎克伯格表示，训练Llama 4所需的算力将比Llama 3高10倍

解决Llama3训练困境！豆包大模型携手港大团队推全新检查点系统 优化训练效率

礼貌AI遇上“癫公”？Claude差点被Llama 3整自闭了！

Llama3压缩版！Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数

Llama3天瘦成Mamba！推理速度提升1.5倍

猛了！Meta震撼发布Llama3.2 视觉方面吊打所有闭源模型？

谷与Meta 齐发力!Llama3.2、更新Gemini 、AlphaChip 等各个都是重头戏

​Salesforce AI 推全新大语言模型评估家族SFR-Judge 基于Llama3构建

法国AI创企Les Ministraux发布全新轻量级模型，性能超越Llama 3！

Meta推出Llama3.370B:新一代AI模型性能超越GPT-4和Gemini1.5Pro

推荐阅读

上云服务

aiOS：第一个基于Mistral7B模型的去中心化AI网络支持Llama-3

解决Llama3训练困境！豆包大模型携手港大团队推全新检查点系统优化训练效率

Salesforce AI 推全新大语言模型评估家族SFR-Judge 基于Llama3构建