LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-02-04 16:21:22 317人关注

微软正式开源超强小模型Phi-4 性能测试超越GPT-4o、Llama-3.1

微软近期在 Hugging Face 平台上发布了名为 Phi-4的小型语言模型,这款模型的参数量仅为140亿,但在多项性能测试中表现出色,超越了众多知名模型,包括 OpenAI 的 GPT-4o 及其他同类开源模型如 Qwen2.5和 Llama-3.1。

Microsoft Phi4 GPT4o LLaMA31 大模型性能对比 AI模型评测

2025-01-24 22:12:45 473人关注

挑战开源AI新高度:DeepSeek V3超越Llama3.1,训练数据达14.8万亿token

中国人工智能公司DeepSeek日前发布了一款具有里程碑意义的开源大语言模型DeepSeek V3。这款拥有6710亿参数的模型不仅规模超越Meta的Llama3.1,在多项基准测试中的表现也优于包括GPT-4在内的主流封闭源模型。

DeepSeek V3 LLaMA3 14万亿tokens 大模型性能对比 AI模型评测

2025-01-18 08:27:45 131人关注

aiOS:第一个基于Mistral7B模型的去中心化AI网络 支持Llama-3

aiOS是 "hyperspaceai" 组织开发的世界首个基于 Mistral7B 模型的去中心化 AI 网络。它旨在彻底改变人工智能的可访问性,让用户能够体验到前沿的去中心化人工智能计算。目前该应用程序处于早期开发阶段,提供给 Windows、Linux 和 macOS 用户下载体验。目前已经支持Llama-3,用户可以免费体验。

Mistral7B 去中心化AI网络 LLaMA3 AI大模型技术 开源AI框架

2025-01-17 08:41:40 75人关注

开源多模态巨兽登场!Meta将于7月23日推出Llama 3 405B模型

Meta又要搞大事情了!他们即将推出一款名为Llama3405B的开源语言模型,这不仅是他们迄今为止最大的模型,而且还是史上最大的开源语言模型。这个巨无霸,拥有惊人的4050亿参数,能在图像和文本之间自如穿梭,彻底颠覆了以往只能处理文本的老黄历。

Meta Llama3 405B 大模型发布 AI大模型技术 Meta Llama3 应用场景 大模型技术原理

2025-01-15 18:14:24 175人关注

最强开源模型来了!Llama3.1以405B参数领先GPT-4o

在人工智能的世界里,开源与闭源的较量从未停歇。而今,Meta AI的Llama3.1模型的发布,似乎为这场较量画上了分水岭。这不仅仅是一个模型的发布,更是开源AI走向成熟的标志,预示着一个全新的时代即将到来。

开源大模型 LLaMA3模型 405B参数模型 最佳开源模型 开源AI技术

2025-01-15 10:13:41 172人关注

OpenBuddy开源大语言模型团队发布Llama3.1-8B模型中文版

Meta最近发布了新一代开源模型系列Llama3.1,其中包括一个405B参数的版本,其性能接近甚至在某些基准测试中超越了GPT-4等闭源模型。Llama3.1-8B-Instruct是该系列中的一个8B参数版本,支持英语、德语、法语、意大利语、葡萄牙语、西班牙语、印地语和泰语,上下文长度高达131072tokens,知识截止日期更新至2023年12月。

OpenBuddy Llama3 中文大模型 1.8B参数模型 开源大模型 中文LLM

2025-01-15 09:16:34 159人关注

神仙打架!Mistral Large2突然开源:1230亿个参数、媲美Llama3.1

继昨天Meta宣布发布最强开源模型Llama3.1之后,Mistral AI在今天凌晨 隆重推出了其旗舰模型 Mistral Large2,这一新产品有 1230亿个参数,拥有超大的128k 上下文窗口,与从这方面来看可以媲美Llama3.1。

Mistral-Large2 开源大模型 1230亿参数 Mistral模型技术 开源AI模型应用

2025-01-15 08:26:40 81人关注

Nvidia AI推ChatQA2:基于Llama3模型,长文本理解和RAG能力媲美GPT-4

在人工智能的快速发展中,长文本上下文理解和检索增强生成(RAG)的能力变得至关重要。Nvidia AI 的最新研究——ChatQA2模型,正是为了应对这一挑战而生。基于强大的Llama3模型,ChatQA2在处理大量文本输入和提供精确、高效的响应方面取得了显著进步。

NVIDIA AI ChatQA2 Llama3 RAG 大模型技术 AI聊天问答系统

2025-01-13 11:11:11 254人关注

扎克伯格表示,训练Llama 4所需的算力将比Llama 3高10倍

Meta 作为大型开源基础语言模型 Llama 的开发者,认为未来训练模型所需的计算力将大幅增加。

扎克伯格 LLaMA4 LLaMA3 10倍算力提升 AI大模型算力需求

2025-01-11 18:41:35 151人关注

解决Llama3训练困境!豆包大模型携手港大团队推全新检查点系统 优化训练效率

在一个由数据和算法主导的数字世界里,人工智能的每一步成长都离不开一个关键元素——检查点(Checkpoint)。想象一下,当你正在训练一个能读懂人心、对答如流的大型语言模型时,这个模型聪明绝顶,但也是个"大胃王",需要海量计算资源来"喂饱"它。在训练过程中,如果突然断电或硬件故障,损失将是巨大的。这时,检查点就像一台"时光机",能让一切回到上一个安全状态,继续未完成的任务。

Llama3 训练检查点系统 大模型训练技术 模型训练优化 LLM训练方法 AI模型检查点机制

2025-01-11 04:27:12 89人关注

礼貌AI遇上“癫公”?Claude差点被Llama 3整自闭了!

在人工智能的神秘领域,一场前所未有的"安全词模拟实验"在X上的人类监督者记录下拉开了帷幕。Llama3.1405B和Claude3超大杯Opus,两个AI被置于封闭环境中,展开了一场充满挑战与未知的对话。

礼貌AI Claude LLaMA3 AI大模型 大模型技术

2025-01-09 07:32:13 153人关注

Llama3压缩版!Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数

在如今科技公司纷纷追逐在设备上实现人工智能的时代,越来越多的小型语言模型(SLM)应运而生,能够在资源受限的设备上运行。最近,Nvidia 的研究团队利用前沿的模型剪枝和蒸馏技术,推出了 Llama-3.1-Minitron4B,这是 Llama3模型的压缩版本。这个新模型在性能上不仅可以与更大的模型媲美,还能与同等规模的小型模型竞争,同时在训练和部署上都显得更加高效。

Llama3 Mini Llama 3 Minitron 4b 大模型技术 大模型技术原理

2025-01-05 13:14:42 256人关注

Llama3天瘦成Mamba!推理速度提升1.5倍

最近,Mamba 团队的研究令人瞩目:来自康奈尔和普林斯顿等高校的研究者们成功将 Llama 这一大型 Transformer 模型 “蒸馏” 成了 Mamba,并设计了一种新型的推理解码算法,显著提高了模型的推理速度。

Llama 3 Mamba 推理速度优化 大模型推理加速 LLM性能提升

2025-01-01 03:28:24 106人关注

猛了!Meta震撼发布Llama3.2 视觉方面吊打所有闭源模型?

Meta 在其年度 Meta Connect2024大会上发布了 Llama3.2,旨在提升边缘 AI 和视觉任务的能力。

Meta Llama3 LLaMA3 2B模型 LLaMA3视觉模型 Meta AI大模型 LLaMA3技术解析

2024-12-31 09:27:41 114人关注

谷与Meta 齐发力!Llama3.2、更新Gemini 、AlphaChip 等各个都是重头戏

最近一周,AI 行业真是热闹非凡,谷歌和 Meta 都在推出新版本的 AI 模型,吸引了不少关注。首先,谷歌在周二宣布了其 Gemini 系列的新更新,推出了两个新的生产就绪模型 ——Gemini-1.5-Pro-002和 Gemini-1.5-Flash-002。

Meta Llama3 Gemini AlphaChip AI大模型 大模型技术对比 芯片技术发展

2024-12-31 04:15:24 131人关注

​Salesforce AI 推全新大语言模型评估家族SFR-Judge 基于Llama3构建

在自然语言处理领域,大型语言模型(LLMs)的发展迅速,已经在多个领域取得了显著的进展。不过,随着模型的复杂性增加,如何准确评估它们的输出就变得至关重要。传统上,我们依赖人类来进行评估,但这种方式既耗时又难以规模化,无法跟上模型快速发展的步伐。

Salesforce AI SFR Judge Llama3 AI大模型 AI技术应用 Salesforce AI新闻

2024-12-25 18:10:43 64人关注

法国AI创企Les Ministraux发布全新轻量级模型,性能超越Llama 3!

法国AI初创公司Les Ministraux 推出两款全新轻量级模型Ministral3B和Ministral8B,专为边缘设备设计,参数分别为30亿和80亿。这两款模型在指令跟随基准测试中表现出色,Ministral3B超越了Llama38B和Mistral7B,Ministral8B则在除代码能力外其他方面均优于这两个模型。

法国AI初创公司 轻量级模型 LLaMA3 AI模型性能对比 AI初创公司技术突破

2024-12-11 07:24:45 100人关注

Meta推出Llama3.370B:新一代AI模型性能超越GPT-4和Gemini1.5Pro

Meta近日宣布,推出其Llama系列的最新成员——Llama3.370B。Meta的生成式AI副总裁Ahmad Al-Dahle在X平台上发布了这一消息,并指出,Llama3.370B在性能上相较于Meta之前最大的Llama模型Llama3.1405B取得了显著进步,同时成本大幅降低。

Meta Llama3 370B AI大模型 Meta Llama3技术解析 大模型技术原理 AI模型应用场景

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10