- 上云资讯 -
2025-02-04 16:21:22 229人关注
微软正式开源超强小模型Phi-4 性能测试超越GPT-4o、Llama-3.1
微软近期在 Hugging Face 平台上发布了名为 Phi-4的小型语言模型,这款模型的参数量仅为140亿,但在多项性能测试中表现出色,超越了众多知名模型,包括 OpenAI 的 GPT-4o 及其他同类开源模型如 Qwen2.5和 Llama-3.1。
2025-01-24 22:12:45 405人关注
挑战开源AI新高度:DeepSeek V3超越Llama3.1,训练数据达14.8万亿token
中国人工智能公司DeepSeek日前发布了一款具有里程碑意义的开源大语言模型DeepSeek V3。这款拥有6710亿参数的模型不仅规模超越Meta的Llama3.1,在多项基准测试中的表现也优于包括GPT-4在内的主流封闭源模型。
2025-01-17 08:41:40 33人关注
开源多模态巨兽登场!Meta将于7月23日推出Llama 3 405B模型
Meta又要搞大事情了!他们即将推出一款名为Llama3405B的开源语言模型,这不仅是他们迄今为止最大的模型,而且还是史上最大的开源语言模型。这个巨无霸,拥有惊人的4050亿参数,能在图像和文本之间自如穿梭,彻底颠覆了以往只能处理文本的老黄历。
2025-01-15 09:16:34 90人关注
神仙打架!Mistral Large2突然开源:1230亿个参数、媲美Llama3.1
继昨天Meta宣布发布最强开源模型Llama3.1之后,Mistral AI在今天凌晨 隆重推出了其旗舰模型 Mistral Large2,这一新产品有 1230亿个参数,拥有超大的128k 上下文窗口,与从这方面来看可以媲美Llama3.1。
2025-01-11 18:41:35 97人关注
解决Llama3训练困境!豆包大模型携手港大团队推全新检查点系统 优化训练效率
在一个由数据和算法主导的数字世界里,人工智能的每一步成长都离不开一个关键元素——检查点(Checkpoint)。想象一下,当你正在训练一个能读懂人心、对答如流的大型语言模型时,这个模型聪明绝顶,但也是个"大胃王",需要海量计算资源来"喂饱"它。在训练过程中,如果突然断电或硬件故障,损失将是巨大的。这时,检查点就像一台"时光机",能让一切回到上一个安全状态,继续未完成的任务。
2025-01-09 07:32:13 100人关注
Llama3压缩版!Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数
在如今科技公司纷纷追逐在设备上实现人工智能的时代,越来越多的小型语言模型(SLM)应运而生,能够在资源受限的设备上运行。最近,Nvidia 的研究团队利用前沿的模型剪枝和蒸馏技术,推出了 Llama-3.1-Minitron4B,这是 Llama3模型的压缩版本。这个新模型在性能上不仅可以与更大的模型媲美,还能与同等规模的小型模型竞争,同时在训练和部署上都显得更加高效。
2025-01-01 03:28:24 66人关注
猛了!Meta震撼发布Llama3.2 视觉方面吊打所有闭源模型?
Meta 在其年度 Meta Connect2024大会上发布了 Llama3.2,旨在提升边缘 AI 和视觉任务的能力。
2024-12-31 04:15:24 76人关注
Salesforce AI 推全新大语言模型评估家族SFR-Judge 基于Llama3构建
在自然语言处理领域,大型语言模型(LLMs)的发展迅速,已经在多个领域取得了显著的进展。不过,随着模型的复杂性增加,如何准确评估它们的输出就变得至关重要。传统上,我们依赖人类来进行评估,但这种方式既耗时又难以规模化,无法跟上模型快速发展的步伐。
2024-12-25 18:10:43 28人关注
法国AI创企Les Ministraux发布全新轻量级模型,性能超越Llama 3!
法国AI初创公司Les Ministraux 推出两款全新轻量级模型Ministral3B和Ministral8B,专为边缘设备设计,参数分别为30亿和80亿。这两款模型在指令跟随基准测试中表现出色,Ministral3B超越了Llama38B和Mistral7B,Ministral8B则在除代码能力外其他方面均优于这两个模型。
2024-12-11 07:24:45 47人关注
Meta推出Llama3.370B:新一代AI模型性能超越GPT-4和Gemini1.5Pro
Meta近日宣布,推出其Llama系列的最新成员——Llama3.370B。Meta的生成式AI副总裁Ahmad Al-Dahle在X平台上发布了这一消息,并指出,Llama3.370B在性能上相较于Meta之前最大的Llama模型Llama3.1405B取得了显著进步,同时成本大幅降低。