- 上云资讯 -
2025-08-01 18:14:43 21人关注
MOSS-TTSD震撼开源:百万小时训练打造AI播客新王者
由清华大学语音与语言实验室(Tencent AI Lab)联合上海创智学院、复旦大学和模思智能打造的MOSS-TTSD(Text to Spoken Dialogue)近日正式开源,标志着AI语音合成技术在对话场景中的重大突破。
AI语音合成 语音对话技术 MOSS-TTSD开源 清华大学语音与语言实验室 Tencent AI Lab 语音合成 文本转语音对话系统
2025-07-31 17:45:27 38人关注
阿里WebShaper发布!GAIA碾压Claude 3.5 Sonnet、GPT-4o
阿里通义实验室(Tongyi Lab)近日重磅推出WebAgent系列的第四款开源工具——WebShaper,这一突破性框架以其创新的“形式化驱动”信息检索范式引发行业热议。据AIbase从社交媒体及相关渠道获悉,WebShaper不仅在GAIA基准测试中取得60.19的高分,超越了Claude3.5Sonnet和GPT-4o,还通过全新的数据生成方法显著提升了AI在复杂任务中的信息检索与推理能力。
阿里通义实验室 WebAgent系列开源工具 WebShaper框架 形式化驱动信息检索 GAIA基准测试高分 AI复杂任务推理能力
2025-07-31 16:33:12 40人关注
OWL团队开源全新多智能体工具Eigent:革新复杂任务处理效率
OWL团队宣布开源一款全新的多智能体协作工具——Eigent。这一工具基于OWL框架开发,旨在通过多智能体协作实现更高效、更专业的复杂任务处理,为开源AI生态系统在任务自动化领域带来又一重大突破。Eigent继承了CAMEL(13k GitHub星)和OWL(17k GitHub星)的成功经验,进一步推动了多智能体协作技术的边界。
2025-07-31 16:21:33 39人关注
Ollama发布桌面客户端!拖拽文档、多模态识别,本地AI从此告别命令行
近年来,本地化AI大模型的开发和应用成为行业热点,Ollama作为一款开源工具,以其强大的本地语言模型运行能力备受关注。近日,AIbase从社交媒体及相关渠道获悉,Ollama正式推出了桌面客户端,彻底告别单一的命令行操作模式,新增直观界面、多模态识别以及文档拖拽功能,为用户带来更便捷、智能的交互体验。
Ollama桌面客户端 Ollama本地化AI大模型 开源AI工具 Ollama多模态识别 Ollama文档拖拽功能 本地语言模型运行工具
2025-07-30 18:34:14 57人关注
OWL团队开源一款多智能体Manus类工具Eigent
人工智能领域的开源创新再迎里程碑!由CAMEL-AI团队开发的OWL项目于近日宣布开源一款全新多智能体协作工具——Eigent。这一工具基于OWL框架构建,旨在通过多智能体协作实现更高效、专业的复杂任务处理,标志着开源AI生态在任务自动化领域的又一次重大突破。
2025-07-30 16:42:22 54人关注
昆仑万维开源多模态统一预训练模型 Skywork UniPic,融合图片生成与理解能力
昆仑万维正式推出了自回归路线的「多模态统一预训练模型 Skywork UniPic」,并将其开源。这款模型在一个系统中集成了图像理解、文本生成图像(T2I)和图像编辑三大核心功能,标志着人工智能技术的进一步发展。
2025-07-30 15:42:22 25人关注
Mistral AI 发布人工智能模型环境影响分析,揭示可持续发展挑战
Mistral AI 是一家位于巴黎的科技公司,专注于开发开放式和开源的大型语言模型。近期,该公司对其一款大型语言模型进行了全面的生命周期分析,旨在评估人工智能技术的环境影响。
2025-07-30 13:26:14 34人关注
昆仑万维开源多模态统一预训练模型 Skywork UniPic
7月30日,昆仑万维正式推出并开源了采用自回归路线的多模态统一预训练模型Skywork UniPic。该模型在单一架构中深度融合了图像理解、文本到图像生成及图像编辑三大核心能力,基于大规模高质量数据端到端预训练,展现了优异的通用性与可迁移性。
昆仑万维Skywork UniPic 多模态统一预训练模型 自回归多模态模型 图像理解与生成技术 端到端预训练模型 Skywork UniPic开源
2025-07-30 10:18:28 70人关注
通义千问开源Qwen3-30B-A3B-Instruct-2507非思考模式模型
7月29日,Qwen3-30B-A3B模型推出了新版本Qwen3-30B-A3B-Instruct-2507。这一新版本在多个关键领域实现了显著提升,标志着该模型在非思考模式(non-thinking mode)下仅激活3B参数,就能达到与Gemini2.5-Flash(non-thinking)、GPT-4o等顶尖闭源模型相媲美的性能。
2025-07-30 09:42:27 26人关注
鸿蒙开源、首款 5G-A 人形机器人获大额融资,乐聚机器人将引领未来智能制造!
深圳的乐聚(深圳)机器人技术有限公司近日迎来了新的发展里程碑,宣布获得了一轮重要的融资。这家专注于人形机器人技术研发的公司,计划在 2025 年前交付多达千台人形机器人,推动其在工业领域的广泛应用。乐聚正与多家行业巨头,如华为云和深开鸿,携手合作,致力于将人形机器人带入更多实际场景中。
2025-07-29 15:14:16 20人关注
只需100行代码,这款迷你编程Agent就能修复65%真实项目Bug!
在编程界,一个全新的开源项目正在引起热议,那就是由 SWE-bench 和 SWE-agent 的开发团队推出的 mini-SWE-agent。这个项目的亮点在于,它仅需100行代码,就能在真实的 GitHub 项目中修复65% 的 Bug,这一性能与原版相比丝毫不逊色,但架构却极其轻量。
mini-SWE-agent SWE-bench SWE-agent 开源项目 轻量级Bug修复工具 GitHub项目修复
2025-07-29 12:35:11 338人关注
智谱发布全能模型GLM-4.5,打破开源AI新高度!
近日,智谱正式推出了其最新旗舰模型 GLM-4.5,这款模型被称为 “专为 Agent 应用打造的基础模型”,并且在推理、代码生成以及智能体综合能力上达到了开源模型的 SOTA(State Of The Art)水平。GLM-4.5的发布标志着国产大模型厂商在开源领域的快速进步,也为开发者们提供了强大的工具。
2025-07-29 10:26:17 91人关注
智谱AI重磅发布GLM-4.5:全球首个原生融合推理、编码、智能体能力的开源模型
智谱AI今日正式发布新一代旗舰模型GLM-4.5,这是一款专为智能体应用打造的基础模型,现已在Hugging Face与ModelScope平台同步开源,模型权重遵循MIT License开源协议。
智谱AI GLM-4.5 智能体应用基础模型 Hugging Face开源模型 ModelScope平台开源模型 MIT License开源协议
2025-07-28 13:35:27 63人关注
阿里巴巴重磅发布三款开源大模型,未来AI将更加智能!
在2025年世界人工智能大会(WAIC)上,阿里巴巴带来了三款全新开源大模型,这一消息无疑为全球 AI 领域注入了一剂强心针。此次发布的模型涵盖了基础模型、编程模型和推理模型,三者都赢得了全球开源领域的最高荣誉,标志着阿里在开源技术上的强大实力。