- 上云资讯 -
2025-12-12 16:13:36 41人关注
Meta开源神话崩塌:闭源新模型竟靠阿里Qwen训练,小扎“煲汤求才”换来战略大转向
曾经高举开源大旗、以“AI时代的安卓”自居的Meta,正悄然走上一条截然相反的道路。彭博社最新爆料称,Meta计划于2026年春季发布代号“Avocado”(牛油果)的全新AI模型——而这款模型,极有可能是闭源的。更令人震惊的是,其训练过程中竟直接使用了阿里巴巴的开源大模型Qwen。
2025-12-06 14:43:17 74人关注
DeepSeek连发两款重磅新模型,正式版V3.2与Speciale同步上线
12月4日,DeepSeek官方毫无预告地连放大招:DeepSeek-V3.2正式版与极致推理版DeepSeek-V3.2-Speciale同时登场。官网网页端、App、API已全部完成一键切换,至此DeepSeek再次用实际性能把“开源最强”四个字焊死在公告栏上。
2025-12-05 08:35:19 234人关注
AI日报:快手可灵 2.6 全量上线;字节Seedream 4.5发布;DeepSeek连发两款新模型
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
2025-11-12 08:17:29 190人关注
AI日报:月之暗面开源AI新框架Kosong;百度发布新模型ERNIE-4.5-VL;GPT-5.1“隐身”登场
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
2025-10-07 08:18:31 328人关注
OpenAI“Codex Alpha”抢先体验!七层级新模型曝光,GPT-5编程能力大升级
科技媒体 BleepingComputer 报道,OpenAI 已为其 AI 编程助手 Codex 推出名为 “Codex Alpha” 的抢先体验计划,邀请开发者和用户在下周的 2025年度开发者日(DevDay2025) 正式发布前,提前试用最新的 Codex 模型和功能。
2025-10-06 18:13:26 329人关注
阿里 Qwen-VL-30B-A3B 新模型发布 数学、视频处理性能获称更强
阿里巴巴 **Qwen(通义千问)**团队近日发布了两个新的小规模多模态模型:Qwen3-VL-30B-A3B-Instruct 和 Qwen3-VL-30B-A3B-Thinking。每个模型拥有 30亿个活跃参数,但在性能上却有着巨大的野心。
2025-10-01 16:36:14 148人关注
Meta 发布新模型 CWM,助力代码理解与生成
近日,Meta 的人工智能研究团队推出了一款名为代码世界模型(Code World Model,简称 CWM)的大型语言模型。
2025-10-01 14:45:32 24人关注
机器人视觉大飞跃!新模型助力 AI “看懂” 三维世界,成功率提升 31%
在机器人领域,让人工智能真正 “看懂” 三维世界一直是一个棘手的问题。传统的视觉语言模型(VLA)大多依赖于二维图像和文本数据训练,难以理解真实环境中的三维空间。然而,最近来自上海交通大学和剑桥大学的研究团队提出了一种名为 Evo-0的新型增强视觉语言动作模型,通过轻量化的方式注入3D 几何先验,使得机器人在复杂任务中的空间理解能力得到了显著提升。
2025-09-21 08:20:21 184人关注
百度文心新模型ERNIE-4.5-21B-A3B-Thinking强势登顶Hugging Face榜首
近日,百度旗下文心大模型家族迎来重大升级——ERNIE-4.5-21B-A3B-Thinking正式开源,并在Hugging Face平台迅速登顶文本生成模型榜单首位,同时位居整体模型榜第三。这款轻量级Mixture-of-Experts(MoE)模型以其卓越的推理能力和参数效率,引发行业广泛关注,标志着中国AI开源生态的又一里程碑。
2025-09-18 18:40:12 232人关注
GPT-4o复活!OpenAI如何应对用户对新模型的情感依赖
就在 GPT-5发布后不久,OpenAI 出乎意料地决定让 GPT-4o 等前代模型复活。用户们的强烈反响让公司意识到,很多人对这些旧模型早已产生了深厚的 “情感依恋”。当 GPT-4o 被下线时,许多用户感觉就像失去了一个熟悉的伙伴,这种反响显然超出了 OpenAI 的预期。
2025-09-16 09:10:19 185人关注
AI日报:小红书发布对话合成模型 FireRedTTS-2;百度文心新模型登顶Hugging Face榜首;xAI将裁员500人
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
2025-09-02 09:14:15 193人关注
Nvidia 推出小型开放模型 Nemotron-Nano-9B-v2:可切换的推理功能
近日,Nvidia 正式发布了一款新型小型语言模型 Nemotron-Nano-9B-v2,标志着小型模型的热潮再度升温。
2025-08-25 12:18:10 290人关注
Cohere推出全新模型Command A Reasoning,专为企业级复杂推理任务打造
Cohere 近日发布了其全新的语言模型 Command A Reasoning,旨在满足商业环境中对高难度推理任务的严苛需求。该模型在处理代理工作流、构建端到端系统和分析大型文档方面表现出色。
2025-08-20 12:14:37 229人关注
DeepSeek神秘新模型登陆LmArena,"快乐机器人"命名引爆AI圈热议
知名AI模型评测平台LmArena近日发布重大更新,上线了两款全新的DeepSeek模型,分别以"非常秘密且有趣的模型"和"高度机密且快乐的机器人"这样极具趣味性的名称命名。这一神秘发布立即在AI社区引发了广泛关注和热烈讨论。
2025-08-16 15:19:31 540人关注
超越FLUX Kontext!新图像编辑模型nano-banana角色还原能力超强
近日,一款名为Nano-Banana的图像编辑AI模型在社交媒体平台上引发热议。据多位用户反馈,这款在lmarena平台上出现的新模型在图像处理能力方面表现突出,被认为在多个关键指标上超越了当前备受认可的FLUX Kontext模型。
Nano-Banana图像编辑AI AI图像处理模型 FLUX Kontext模型对比 lmarena平台新模型 图像编辑AI性能评测
2025-08-15 12:33:43 178人关注
西班牙AI独角兽发布两款超微型模型:可在手表、家电上流畅运行
欧洲知名人工智能初创公司 Multiverse Computing 近日推出两款极微型AI模型,分别命名为 “ChickBrain” 和 “SuperFly”。公司称,这可能是目前全球最小且性能依然强劲的模型,能够在智能手机、平板、PC甚至物联网设备上离线运行。
极微型AI模型 Multiverse Computing 新模型 ChickBrain 和 SuperFly 离线运行AI模型 物联网设备AI应用
2025-08-11 16:40:45 159人关注
小钢炮4.0视觉模型MiniCPM-V 4.0,手机端应用更流畅
在人工智能的持续发展中,最近一款新模型 MiniCPM-V4.0引起了广泛关注。该模型是 MiniCPM-V 系列的最新版本,具有4.1亿参数,基于 SigLIP2-400M 和 MiniCPM4-3B 进行构建。与之前的版本相比,MiniCPM-V4.0在单图、多图及视频理解方面表现出色,并且在效率上有了显著提升。
MiniCPM-V4.0 人工智能新模型 MiniCPM-V 系列 4.1亿参数模型 SigLIP2-400M 构建 MiniCPM4-3B 构建 单图多图视频理解
2025-08-09 14:22:32 233人关注
微软Bing Image Creator免费上线GPT-4o图像生成模型
微软宣布Bing Image Creator现已免费提供OpenAI最新的GPT-4o图像生成模型,为用户带来更强大的AI图像创作体验。
微软Bing Image Creator GPT-4o图像生成模型 AI图像创作 OpenAI最新模型 免费AI图像生成工具
2025-08-09 13:27:38 114人关注
微软大漏勺!GPT-5信息提前泄露 将推出四种变体
近期网络上关于OpenAI最新一代模型GPT-5的泄露信息引发广泛关注。据悉,GPT-5将成为OpenAI迄今为止最先进的语言模型,带来推理能力、代码质量和用户体验的全面升级。AIbase整理了相关信息,深入解析GPT-5及其四大变体的核心亮点,揭示其如何重塑AI应用格局。
