- 上云资讯 -
2025-09-16 18:37:22 25人关注
告别模糊!英伟达发布ViPE引擎 为空间AI提供高精度3D数据
近日,英伟达与多伦多大学、向量研究所及德克萨斯大学奥斯汀分校的研究团队联合发布了一项名为 **ViPE(视频姿势引擎)**的突破性技术。ViPE 旨在解决3D几何感知领域的关键挑战,即如何从复杂的自然视频中高效且精准地提取3D信息。
2025-09-16 18:13:44 19人关注
腾讯启动AI应用繁荣计划,超300家企业抢滩智能体新赛道
9月16日,2025腾讯全球数字生态大会在深圳启动,腾讯正式发布AI应用繁荣计划,标志着AI产业应用进入"深度渗透期"。该计划涵盖"AI共创营"和"AI百校行"两大核心模块,已吸引超300家企业报名参与。
2025-09-16 17:36:21 12人关注
VEED Fabric 1.0发布!一张图片变身“会说话”视频
近日,VEED推出Fabric1.0,这款被誉为“全球首款AI会说话视频模型”的创新工具,仅需一张图片即可生成任意会说话视频,具备逼真的唇形同步和自然面部表情。官方表示,该模型最长支持1分钟视频生成,成本降低60倍、速度提升7倍。这一发布迅速在科技圈引发热议,开发者与内容创作者反馈其在社交广告、产品演示和教育内容领域的应用潜力巨大。
2025-09-16 17:17:32 27人关注
Meta AI 发布 MobileLLM-R1:轻量级边缘推理模型,参数不足 10 亿,性能提升显著
Meta AI 近日推出了 MobileLLM-R1,这是一系列轻量级边缘推理模型,目前已在 Hugging Face 上发布。该系列模型参数范围从140M 到950M,专注于高效的数学、编码和科学推理,且在不足10亿的参数规模下实现了优秀的性能表现。
2025-09-16 16:32:20 22人关注
逻辑智能发布全球首个开源语音大模型框架 LLaSO
在人工智能的快速发展浪潮中,北京深度逻辑智能科技有限公司于近日推出了一项令人瞩目的创新 ——LLaSO。这一开创性的研究框架被称为全球首个完全开放、端到端的语音语言模型,标志着语音识别和处理技术的新高度。
2025-09-16 16:28:36 16人关注
哈佛法学生创办MarqVision获4800万美元融资 借助AI打击品牌侵权
在哈佛法学院读书期间,马克・李(Mark Lee)上了一门商标法课程,了解到全球每年有超过3万亿美元的假冒产品交易,这一惊人的数据令他意识到反假冒产业的庞大。虽然他最初打算成为一名律师,但随着对法律职业的重新思考,他决定踏上创业之路。
2025-09-16 15:41:38 19人关注
免费!Genspark AI 浏览器发布:支持本地运行开源模型
近日,Genspark AI 浏览器正式发布,官方宣称其为全球首款支持本地运行开源模型的 AI 浏览器。这款浏览器的特别之处在于,用户可以在无需联网的情况下,直接在本地设备上运行多达169款开源模型,包括 GPT-OSS 和 Gemma3等。使用这款浏览器,用户能够享受极快的响应速度,并且完全免费。
2025-09-16 15:26:34 22人关注
马斯克旗下 xAI 发布 Grok 4 Fast:速度提升十倍但细节有所妥协
据testingcatalog报道,近日,xAI 正式推出了 Grok4Fast,这是一款全新的模型,用户可以通过 Grok 网页版的模型选择器来访问。为了体验这一新功能,用户需要在订阅设置中启用一个新的早期访问模式切换按钮。Grok4Fast 最大的亮点在于其速度,用户反馈称该模型的响应速度比标准的 Grok4快了多达10倍。这一版本的主要特点是优化了快速响应,尽量减少在复杂任务上的处理时间。
2025-09-16 14:41:44 23人关注
OpenAI Evals新增原生音频输入和评估功能
近日,OpenAI 的 Evals 工具迎来了令人振奋的重大更新,新增了原生音频输入和评估功能。这一创新意味着开发者们在测试和优化语音识别与生成模型时,可以直接使用音频文件进行评估,而无需经过繁琐的文本转录过程。这一变化极大地简化了评估流程,使得音频应用的开发变得更加高效。
2025-09-16 14:17:13 26人关注
五年沉寂后高调回归,OpenAI重组机器人团队剑指“通用机器人”
OpenAI 正在重返机器人研究领域,这标志着该公司在中断五年之后,重新将物理人工智能(AI)作为其核心关注点。《连线》杂志报道称,OpenAI 正在招聘专门从事人形机器人研究的人员,旨在通过远程操作和模拟训练,打造能够执行通用任务的机器人。
2025-09-16 13:45:13 21人关注
OpenAI Evals 新增原生音频评估功能,简化语音模型测试
OpenAI 正在进一步拓展其 Evals 工具的功能,为开发者带来了原生音频输入和音频评分支持。这项更新意味着,现在可以直接评估模型的音频响应,而无需先进行文本转录。这一新功能极大地简化了语音识别和语音生成模型的评估流程。
2025-09-16 13:21:28 20人关注
昆仑万维AI 音乐创作平台Mureka上线Agent Studio功能,让音乐创作变得触手可及!
近日,昆仑万维旗下的 AI 音乐创作平台 Mureka 全新推出了「Agent Studio」功能。这一功能旨在让音乐创作变得更加简单和便捷,使得每个人都能体验到音乐创作的乐趣。
2025-09-16 12:39:39 25人关注
瑞士三强联合发布开源大模型Apertus 挑战美国科技巨头
近日,瑞士联邦理工学院洛桑分校(EPFL)、苏黎世联邦理工学院(ETH Zurich)以及瑞士国家超级计算中心(CSCS)联合发布了一个名为 “Apertus” 的大规模开源语言模型。该模型的名字在拉丁语中意为 “开放”,而其开发理念恰恰体现了这一精神。
2025-09-16 12:25:32 28人关注
新工具来袭!BentoML发布llm-optimizer,助你轻松优化LLM推理性能
近日,知名开源项目 BentoML 推出了一款名为 llm-optimizer 的全新工具,旨在为开发者提供一种简单而高效的方法来优化大型语言模型(LLM)的推理性能。随着人工智能技术的迅速发展,LLM 的应用也越来越广泛,如何高效地部署和使用这些模型成为了不少开发者面临的挑战。llm-optimizer 的推出,无疑为这一问题提供了极具价值的解决方案。
2025-09-16 11:33:15 23人关注
哈佛推出新 AI 工具,助力治疗帕金森、阿尔茨海默和癌症
最近,哈佛医学院公布了一项名为 PDGrapher 的新型人工智能模型。这项研究表明,该模型能够分析细胞内部基因、蛋白质和信号通路之间的联系,从而找到有效的治疗组合,帮助恢复病变细胞的健康状态。这一创新有可能在药物研发方面产生深远的影响。
2025-09-16 11:10:38 25人关注
谷歌 AI 承包商裁员风波:200 多名员工因工作条件争议被解雇
谷歌近期对外包公司 GlobalLogic 的承包商进行了裁员,超过200名员工因工薪和工作条件问题被解雇。这一行动引发了员工的不满和抗议,他们指出长期以来的低薪与恶劣的工作环境,导致这一冲突不断升级。
2025-09-16 10:45:16 25人关注
瑞士科技新突破:Apertus开源模型挑战AI“黑箱”,全面公开训练细节
瑞士的科研机构正在联手挑战大型语言模型的“黑箱”现状。瑞士联邦理工学院洛桑分校(EPFL)、**苏黎世联邦理工学院(ETH Zurich)以及瑞士国家超级计算中心(CSCS)**近日发布了一款名为 Apertus 的大规模开源语言模型。该模型不仅在名称上——拉丁语意为“开放”——彰显了其核心理念,更在实践中将“开放”做到了极致。
2025-09-16 10:20:41 55人关注
OpenAI重磅推出GPT-5-Codex:AI编码代理将彻底颠覆开发者世界
OpenAI近日正式发布GPT-5-Codex,这是一款基于GPT-5进一步优化的版本,专为代理式编码(agentic coding)量身定制。该模型标志着AI从辅助工具向自主“编程伙伴”的重大跃进,将极大提升软件开发效率。根据最新信息整理,该发布于2025年9月15日迅速引发全球科技圈热议,开发者反馈显示其在复杂任务处理上表现出色,已成为Codex平台流量主力。
2025-09-16 09:18:45 37人关注
历史性逆转!谷歌Gemini终结ChatGPT霸榜神话,登顶美区iOS免费榜
谷歌旗下的AI助手Gemini在美国iOS平台实现历史性突破,下载量首次超越长期霸榜的ChatGPT,成功登顶免费应用下载榜首位。
2025-09-16 09:10:19 30人关注
AI日报:小红书发布对话合成模型 FireRedTTS-2;百度文心新模型登顶Hugging Face榜首;xAI将裁员500人
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。