- 上云资讯 -
2025-09-16 16:32:20 24人关注
逻辑智能发布全球首个开源语音大模型框架 LLaSO
在人工智能的快速发展浪潮中,北京深度逻辑智能科技有限公司于近日推出了一项令人瞩目的创新 ——LLaSO。这一开创性的研究框架被称为全球首个完全开放、端到端的语音语言模型,标志着语音识别和处理技术的新高度。
2025-09-16 15:41:38 21人关注
免费!Genspark AI 浏览器发布:支持本地运行开源模型
近日,Genspark AI 浏览器正式发布,官方宣称其为全球首款支持本地运行开源模型的 AI 浏览器。这款浏览器的特别之处在于,用户可以在无需联网的情况下,直接在本地设备上运行多达169款开源模型,包括 GPT-OSS 和 Gemma3等。使用这款浏览器,用户能够享受极快的响应速度,并且完全免费。
2025-09-16 12:39:39 27人关注
瑞士三强联合发布开源大模型Apertus 挑战美国科技巨头
近日,瑞士联邦理工学院洛桑分校(EPFL)、苏黎世联邦理工学院(ETH Zurich)以及瑞士国家超级计算中心(CSCS)联合发布了一个名为 “Apertus” 的大规模开源语言模型。该模型的名字在拉丁语中意为 “开放”,而其开发理念恰恰体现了这一精神。
2025-09-16 10:45:16 27人关注
瑞士科技新突破:Apertus开源模型挑战AI“黑箱”,全面公开训练细节
瑞士的科研机构正在联手挑战大型语言模型的“黑箱”现状。瑞士联邦理工学院洛桑分校(EPFL)、**苏黎世联邦理工学院(ETH Zurich)以及瑞士国家超级计算中心(CSCS)**近日发布了一款名为 Apertus 的大规模开源语言模型。该模型不仅在名称上——拉丁语意为“开放”——彰显了其核心理念,更在实践中将“开放”做到了极致。
2025-09-16 08:26:24 66人关注
开源生态大洗牌!蚂蚁发布AI项目全景图2.0,114个项目见证技术变革浪潮
人工智能开源生态正在经历一场前所未有的变革洗礼。蚂蚁集团在外滩大会上重磅发布的大模型开源开发全景与趋势2.0版本,如同一面镜子,清晰映射出这个快速演进领域的真实面貌。
2025-09-15 17:40:26 51人关注
蚂蚁开源在外滩大会发布2025全球大模型开源生态全景图,揭示AI开发三大趋势
9月13日,在2025Inclusion·外滩大会AI开源见解论坛上,蚂蚁开源联合Inclusion AI 发布了全新的《全球大模型开源开发生态全景与趋势报告》。
2025-09-12 17:18:45 60人关注
挑战主流认知!蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型
蚂蚁集团和人民大学联合研发原生MoE架构扩散语言模型(dLLM) LLaDA-MoE,在约20T数据上完成了从零训练MoE架构的扩散语言模型,验证了工业级大规模训练的扩展性和稳定性;效果超过此前发布稠密扩散语言模型LLaDA1.0/1.5和Dream-7B,比肩等效自回归模型,并保有数倍的推理速度优势。模型将在近期完全开源,以推动全球AI社区在dLLM上的技术发展。
MoE架构扩散语言模型 LLaDA-MoE模型开源 dLLM技术发展 工业级大规模训练 扩散语言模型推理速度优势 AI社区技术推动
2025-09-11 18:34:14 77人关注
腾讯开源图检索增强生成框架Youtu-GraphRAG
9月11日,腾讯优图实验室开源了Youtu-GraphRAG,这是一个全新的图检索增强生成框架,旨在通过大语言模型+RAG模式,将知识组织成图谱,再交给大语言模型进行检索和推理,从而提高模型在处理复杂问答任务时的准确性和可追溯性。Youtu-GraphRAG特别适用于企业知识库问答、科研文档解析、个人知识管理等知识密集型场景。
腾讯优图实验室 Youtu-GraphRAG开源 图检索增强生成框架 大语言模型+RAG模式 知识图谱组织 企业知识库问答 科研文档解析 个人知识管理
2025-09-11 17:15:19 51人关注
B 站开源文本转语音模型IndexTTS-2.0,情感与时长可控
近日,哔哩哔哩(B 站)Index 团队宣布全面开源其自主研发的文本转语音(TTS)系统 ——IndexTTS-2.0。该系统具有情感可控和时长可调的特点,标志着零样本 TTS 技术的实用化迈出了重要一步。
IndexTTS-2.0开源 零样本TTS技术 情感可控语音合成 时长可调TTS系统 哔哩哔哩Index团队 文本转语音开源项目
2025-09-11 16:13:29 63人关注
重磅!月之暗面开源革命性中间件 “Checkpoint Engine”,为 LLM 推理引擎带来新生机!
在人工智能领域,尤其是在大规模语言模型(LLM)的推理与训练中,模型权重的实时更新一直是一个技术挑战。最近,月之暗面(MoonshotAI)开源了一个名为 “Checkpoint Engine” 的新中间件,专为 LLM 推理引擎而设计。这一创新工具的发布,标志着在强化学习等应用场景中,模型的权重可以实现更为高效的原地热更新。
2025-09-11 12:25:43 412人关注
腾讯开源HunyuanImage 2.1!2K高清神图秒生成,复杂提示精准控多主体,AI设计效率爆表?
腾讯混元团队近日正式开源HunyuanImage2.1,这一高效文本到图像生成模型,支持原生2K(2048×2048)分辨率图像输出,标志着开源AI在高分辨率创作领域的重大进步。该模型已在Hugging Face和GitHub平台全面开放,开发者可轻松集成使用。HunyuanImage2.1通过大规模数据集和多专家模型优化结构化描述,大幅提升文本-图像对齐能力,生成速度与1K图像相当,预计将加速AI在设计、广告和内容创作中的应用。
HunyuanImage2.1开源 文本到图像生成模型 2K分辨率AI图像生成 开源AI高分辨率创作 腾讯混元AI模型 文本-图像对齐优化
2025-09-11 09:13:13 69人关注
硅基流动上线线蚂蚁集团Ling-mini-2.0,速度与性能双丰收
近日,硅基流动大模型服务平台正式上线了蚂蚁集团百灵团队最新开源的 Ling-mini-2.0。这个新模型在保持先进性能的同时,展现出极高的生成速度,标志着在小体量的同时实现了大能量的突破。
蚂蚁集团百灵开源模型 Ling-mini-2.0 性能 Ling-mini-2.0 生成速度 硅基流动大模型平台 小体量大能量模型
2025-09-10 11:38:32 41人关注
清华团队开源 GUAVA:0.1秒一张照片秒变 3D 数字人,
在数字人领域,清华深研院与国际数字经济研究院的中国团队近日推出了名为 GUAVA 的新技术,标志着数字人制作进入了一个全新的时代。通过仅一张照片,GUAVA 能够在0.1秒内生成一个高质量的3D 高斯化身,并实时驱动,画面流畅度超过50帧每秒。
2025-09-08 10:18:16 43人关注
微软推出新型 AI Agent 模型 rStar2-Agent,以 140 亿参数挑战大规模模型
微软最近在 AI 领域取得了显著突破,开源了一款名为 rStar2-Agent 的 AI Agent 推理模型。这款模型采用了创新的智能体强化学习方法,令人惊讶的是,尽管其参数仅有140亿,但在 AIME24数学推理测试中,准确率高达80.6%,成功超越了拥有6710亿参数的 DeepSeek-R1(79.8%)。这样的表现让人们重新思考模型的参数规模与性能之间的关系。
2025-09-05 16:35:36 61人关注
钉钉与OpenDataLab联合推出文档解析工具DLU
在快速发展的人工智能领域,OpenDataLab 与钉钉携手推出了一款名为 DLU 的文档解析工具,旨在帮助企业用户更高效地处理和理解专业内容。这款工具基于强大的智能文档解析引擎 MinerU 开发,预计将在近期开源,助力 AI 应用的普及与落地。
DLU文档解析工具 智能文档解析引擎MinerU OpenDataLab与钉钉合作 企业文档处理工具 AI文档解析开源 DLU开源计划
2025-09-05 13:13:19 314人关注
瑞士重磅发布自主开源AI大模型Apertus
在全球人工智能技术蓬勃发展的背景下,瑞士于近日正式推出了其首个完全开源的大语言模型 ——Apertus。这一模型由瑞士联邦理工学院(EPFL)、苏黎世联邦理工学院(ETH Zurich)以及国家超级计算中心(CSCS)共同研发,标志着瑞士在人工智能领域的自主创新迈出了重要一步。
瑞士Apertus大语言模型 开源AI模型 瑞士人工智能创新 EPFL人工智能研究 ETH Zurich语言模型 CSCS超级计算 瑞士自主AI技术
2025-09-04 18:15:19 228人关注
Kimi K2-0905 上线 Discord,仍无思考与视觉能力
9月5日,月之暗面(Moonshot AI) 在其官方 Discord 发布新版本 Kimi K2-0905 模型。据介绍,新版本重点提升了 编程能力,同时在 创意写作 方面也有增强。这是是继2025年7月发布全球首个人工智能开源万亿参数模型Kimi K2之后的又一重要进展。
Kimi K2-0905 模型发布 月之暗面 Moonshot AI AI 编程能力提升 创意写作增强 人工智能开源万亿参数模型