- 上云资讯 -
2025-09-12 17:18:45 60人关注
挑战主流认知!蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型
蚂蚁集团和人民大学联合研发原生MoE架构扩散语言模型(dLLM) LLaDA-MoE,在约20T数据上完成了从零训练MoE架构的扩散语言模型,验证了工业级大规模训练的扩展性和稳定性;效果超过此前发布稠密扩散语言模型LLaDA1.0/1.5和Dream-7B,比肩等效自回归模型,并保有数倍的推理速度优势。模型将在近期完全开源,以推动全球AI社区在dLLM上的技术发展。
MoE架构扩散语言模型 LLaDA-MoE模型开源 dLLM技术发展 工业级大规模训练 扩散语言模型推理速度优势 AI社区技术推动
2025-09-11 18:34:14 77人关注
腾讯开源图检索增强生成框架Youtu-GraphRAG
9月11日,腾讯优图实验室开源了Youtu-GraphRAG,这是一个全新的图检索增强生成框架,旨在通过大语言模型+RAG模式,将知识组织成图谱,再交给大语言模型进行检索和推理,从而提高模型在处理复杂问答任务时的准确性和可追溯性。Youtu-GraphRAG特别适用于企业知识库问答、科研文档解析、个人知识管理等知识密集型场景。
腾讯优图实验室 Youtu-GraphRAG开源 图检索增强生成框架 大语言模型+RAG模式 知识图谱组织 企业知识库问答 科研文档解析 个人知识管理
2025-09-05 13:13:19 314人关注
瑞士重磅发布自主开源AI大模型Apertus
在全球人工智能技术蓬勃发展的背景下,瑞士于近日正式推出了其首个完全开源的大语言模型 ——Apertus。这一模型由瑞士联邦理工学院(EPFL)、苏黎世联邦理工学院(ETH Zurich)以及国家超级计算中心(CSCS)共同研发,标志着瑞士在人工智能领域的自主创新迈出了重要一步。
瑞士Apertus大语言模型 开源AI模型 瑞士人工智能创新 EPFL人工智能研究 ETH Zurich语言模型 CSCS超级计算 瑞士自主AI技术
2025-09-04 17:14:38 67人关注
DeepL 推出企业级 AI 智能体,挑战 OpenAI 与微软
德国初创公司 DeepL 宣布将业务从翻译拓展至 企业通用 AI 智能体 领域。新推出的 DeepL 智能体 能跨人力资源、市场营销等部门执行重复性和耗时任务,支持自然语言指令操作。该产品基于 DeepL 自研大型语言模型,并整合外部模型。
DeepL AI 智能体 DeepL 企业 AI 应用 DeepL 语言模型 企业 AI 智能体 DeepL 业务拓展 自然语言指令 AI
2025-09-04 13:22:41 128人关注
Meta 推出 DeepConf 技术,智能平衡大型语言模型的推理成本与准确性
近日,Meta AI 联合加州大学圣地亚哥分校(UCSD)推出了一种名为 Deep Think with Confidence(DeepConf) 的新技术,旨在帮助企业在大语言模型(LLM)的复杂推理任务中,有效降低算力成本的同时保持高准确率 。
大语言模型推理优化 DeepConf 技术解析 LLM 算力成本降低 复杂推理任务效率提升 Meta AI 与 UCSD 合作研究 企业级 AI 应用优化
2025-09-04 10:40:15 45人关注
法国 AI 巨头 Mistral 即将获得 140 亿美元估值
法国初创公司 Mistral AI 正在完成一轮20亿欧元的投资,预计其后市估值将达到140亿美元。这使得 Mistral 成为欧洲最具价值的科技初创公司之一。Mistral 成立于两年前,由前 DeepMind 和 Meta 的研究人员创办,专注于开发开源语言模型以及针对欧洲市场的 AI 聊天机器人 “Le Chat”。
2025-09-03 17:20:43 113人关注
苹果重磅开源FastVLM与MobileCLIP2:85倍速度飙升,iPhone秒变AI神器!
近日,苹果公司低调地在Hugging Face平台上开源了两款重量级视觉语言模型(VLM)——FastVLM和MobileCLIP2,引发了AI领域的广泛关注。这两款模型以其惊艳的性能优化和高效的本地运行能力,为边缘设备AI应用开辟了新的可能性。AIbase编辑团队深入分析了这两款模型的技术亮点与潜在应用场景,为读者带来最新解读。
苹果开源视觉语言模型 FastVLM 性能优化 MobileCLIP2 本地运行能力 边缘设备AI应用 视觉语言模型技术亮点
2025-09-02 15:39:32 196人关注
开源多模态模型MiniCPM-V 4.5发布,8亿参数实现移动端AI部署
近日,开源AI社区迎来重要进展,面向端侧设备的多模态大语言模型MiniCPM-V4.5正式发布。这款模型以8亿参数规模实现了在智能手机和平板电脑上的高效运行,为移动端AI应用开拓了新的可能性。
2025-09-02 09:14:15 60人关注
Nvidia 推出小型开放模型 Nemotron-Nano-9B-v2:可切换的推理功能
近日,Nvidia 正式发布了一款新型小型语言模型 Nemotron-Nano-9B-v2,标志着小型模型的热潮再度升温。
2025-09-01 13:28:17 72人关注
腾讯ARC开源音频模型 AudioStory:用大语言模型生成长音频
近日,腾讯 ARC 团队发布了一款名为 AudioStory 的模型,旨在利用大语言模型(LLMs)生成长篇叙事音频。该模型解决了现有文本到音频生成技术在处理短音频方面的优势与长篇叙事音频在时间连贯性与组合推理上的挑战。
腾讯ARC团队AudioStory模型 大语言模型生成长篇音频 文本到音频生成技术 长篇叙事音频时间连贯性 音频生成组合推理挑战
2025-09-01 12:23:20 196人关注
美团推出开源大模型LongCat:旨在赋能开发者,加速AI应用落地
近日,美团正式发布其最新的开源大语言模型 LongCat(龙猫),旨在推动人工智能技术的发展和应用。该模型的发布不仅标志着美团在AI领域的又一重要进展,也为开发者和研究人员提供了一个功能强大的新工具。
2025-08-29 16:37:23 169人关注
SuperCLUE多模态视觉8月评测榜:Gemini-2.5-Pro位居第一
在8月28日发布的中文多模态视觉语言模型测评基准(SuperCLUE-VLM)榜单中,Gemini-2.5-Pro 以总分74.99分位居第一,OpenAI 的 GPT-5(high) 以68.59分排在第二位。
Gemini-2.5-Pro 登顶 SuperCLUE-VLM 榜单 多模态模型评测 GPT-5(high) 排名第二 视觉语言模型性能对比 大模型多模态能力评估
2025-08-28 09:11:27 115人关注
NVIDIA 推出 Jet-Nemotron:53 倍提速的混合架构语言模型实现 98% 的推理成本节约
近日,NVIDIA 的研究团队宣布发布 Jet-Nemotron,这是一系列全新的语言模型(包含2亿和4亿参数的版本),其生成速度比当前最领先的全注意力语言模型高出53.6倍,并在准确性上达到了甚至超过了这些模型的水平。这一突破不是通过从头开始重新训练模型实现的,而是采用了一种名为 “后神经架构搜索”(PostNAS)的新技术对现有预训练模型进行了改造。
2025-08-23 11:32:18 45人关注
刷新科技前沿!InternLM推出8B参数的轻量级多模态推理模型
近日,InternLM 团队正式发布了其开源的轻量级多模态推理模型 ——Intern-S1-mini。该模型参数仅为8B,结合了先进的 Qwen3-8B 语言模型与0.3B 视觉编码器 InternViT,展现出强大的处理能力和灵活性。
InternLM开源模型 轻量级多模态推理 Intern-S1-mini参数 Qwen3-8B语言模型 InternViT视觉编码器