- 上云资讯 -
2025-09-16 12:39:39 29人关注
瑞士三强联合发布开源大模型Apertus 挑战美国科技巨头
近日,瑞士联邦理工学院洛桑分校(EPFL)、苏黎世联邦理工学院(ETH Zurich)以及瑞士国家超级计算中心(CSCS)联合发布了一个名为 “Apertus” 的大规模开源语言模型。该模型的名字在拉丁语中意为 “开放”,而其开发理念恰恰体现了这一精神。
2025-09-16 10:45:16 28人关注
瑞士科技新突破:Apertus开源模型挑战AI“黑箱”,全面公开训练细节
瑞士的科研机构正在联手挑战大型语言模型的“黑箱”现状。瑞士联邦理工学院洛桑分校(EPFL)、**苏黎世联邦理工学院(ETH Zurich)以及瑞士国家超级计算中心(CSCS)**近日发布了一款名为 Apertus 的大规模开源语言模型。该模型不仅在名称上——拉丁语意为“开放”——彰显了其核心理念,更在实践中将“开放”做到了极致。
2025-09-15 18:36:29 20人关注
苹果 AI 转型面临新挑战:Siri 前负责人离职,AI 搜索项目前景未卜
据知情人士透露,苹果公司人工智能与搜索业务的资深主管**罗比·沃克(Robby Walker)**将于下月离职。沃克的离开再次引发了外界对苹果在人工智能领域发展前景的担忧,也加剧了市场对其能否成功转型的疑虑。
2025-09-15 10:14:45 0人关注
大模型不再是“万能钥匙”?探秘 AI 初创公司的新策略与挑战
据techcrunch报道, 曾经被视为 AI 领域“皇冠上的明珠”的基础模型,其主导地位正在面临前所未有的挑战。AI 初创公司的焦点已悄然转向面向特定任务的定制化模型和用户界面,将基础模型视为可替换的“商品”。这一趋势在近期的 Boxworks 会议上表现得尤为明显,整个行业似乎正在告别对通用人工智能(AGI)的追逐,转而进入一个分散化、专业化的新时代。
2025-09-12 17:18:45 62人关注
挑战主流认知!蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型
蚂蚁集团和人民大学联合研发原生MoE架构扩散语言模型(dLLM) LLaDA-MoE,在约20T数据上完成了从零训练MoE架构的扩散语言模型,验证了工业级大规模训练的扩展性和稳定性;效果超过此前发布稠密扩散语言模型LLaDA1.0/1.5和Dream-7B,比肩等效自回归模型,并保有数倍的推理速度优势。模型将在近期完全开源,以推动全球AI社区在dLLM上的技术发展。
MoE架构扩散语言模型 LLaDA-MoE模型开源 dLLM技术发展 工业级大规模训练 扩散语言模型推理速度优势 AI社区技术推动
2025-09-11 10:29:18 28人关注
全球高校 “猎杀” AI作业!学生如何应对 “人类化” 挑战?
随着生成式人工智能技术的迅猛发展,学生们曾一度享受到了快速完成作业的 “甜头”。在2023至2024年间,许多大学生通过 ChatGPT 等工具,轻松地在短短10分钟内生成论文,甚至自信地认为教师无法识别。然而,这种蜜月期似乎已经结束,全球高校正迅速开启对 AI 作业的 “猎杀模式”。
AI作业检测技术 AI生成论文识别 高校AI学术诚信政策 ChatGPT作业反作弊 生成式AI教育监管 学术诚信与AI工具使用
2025-09-09 10:11:12 36人关注
微软14B参数模型挑战671B巨型AI 智能体强化学习重新定义数学推理
微软研究院开源的rStar2-Agent模型在AI数学推理领域引发关注,这款140亿参数的模型通过创新的智能体强化学习技术,在多项数学基准测试中超越了参数量达6710亿的DeepSeek-R1模型。
2025-09-08 12:27:18 20人关注
Koah获500 万美元融资,致力于在 AI 应用中引入广告
在如今的互联网时代,AI 技术日益普及,如何让 AI 产品实现盈利成了创业公司和开发者面临的重要挑战。一个名为 Koah 的初创公司,最近成功融资500万美元,计划通过广告来解决这一问题。
2025-09-08 10:18:16 43人关注
微软推出新型 AI Agent 模型 rStar2-Agent,以 140 亿参数挑战大规模模型
微软最近在 AI 领域取得了显著突破,开源了一款名为 rStar2-Agent 的 AI Agent 推理模型。这款模型采用了创新的智能体强化学习方法,令人惊讶的是,尽管其参数仅有140亿,但在 AIME24数学推理测试中,准确率高达80.6%,成功超越了拥有6710亿参数的 DeepSeek-R1(79.8%)。这样的表现让人们重新思考模型的参数规模与性能之间的关系。
2025-09-06 08:15:24 89人关注
OpenAI 携手博通大手笔投资:自研芯片即将量产,向英伟达发起挑战
OpenAI 最近与美国半导体巨头博通达成了一项重要的战略合作协议,计划共同设计并量产自研的人工智能芯片。这一消息在9月5日被《金融时报》首次披露,透露出 OpenAI 将通过这项合作,降低对英伟达的依赖。
2025-09-04 17:14:38 67人关注
DeepL 推出企业级 AI 智能体,挑战 OpenAI 与微软
德国初创公司 DeepL 宣布将业务从翻译拓展至 企业通用 AI 智能体 领域。新推出的 DeepL 智能体 能跨人力资源、市场营销等部门执行重复性和耗时任务,支持自然语言指令操作。该产品基于 DeepL 自研大型语言模型,并整合外部模型。
DeepL AI 智能体 DeepL 企业 AI 应用 DeepL 语言模型 企业 AI 智能体 DeepL 业务拓展 自然语言指令 AI
2025-09-04 08:24:40 69人关注
苹果人工智能领军者加入 Meta,AI 人才流失潮加剧
苹果公司的首席人工智能研究员 Jian Zhang 已经正式离开公司,加入 Meta Platforms Inc. 的机器人工作室。Jian Zhang 的离职标志着苹果在人工智能领域面临着人才流失的问题,尤其是在机器人技术的研发方面。
苹果AI人才流失 苹果首席AI研究员张建离职 张建加入Meta机器人工作室 苹果机器人技术研发挑战 苹果与Meta人才竞争
2025-09-02 13:26:14 83人关注
苹果推出 STARFlow:全新 AI 图像生成技术想力压 DALL-E 与 Midjourney
苹果公司的机器学习研究团队最近研发出了一种名为 “STARFlow” 的全新 AI 图像生成系统。这项技术可能会挑战目前主流的扩散模型,后者是像 DALL-E 和 Midjourney 等流行图像生成器的核心。这项突破性进展在上周的一篇研究论文中进行了详细介绍,研究团队在开发过程中与多所学术机构进行了合作。
STARFlow AI 图像生成系统 苹果机器学习研究 AI 图像生成技术 扩散模型挑战者 STARFlow 与 DALL-E 对比 AI 图像生成研究论文
2025-09-01 13:28:17 72人关注
腾讯ARC开源音频模型 AudioStory:用大语言模型生成长音频
近日,腾讯 ARC 团队发布了一款名为 AudioStory 的模型,旨在利用大语言模型(LLMs)生成长篇叙事音频。该模型解决了现有文本到音频生成技术在处理短音频方面的优势与长篇叙事音频在时间连贯性与组合推理上的挑战。
腾讯ARC团队AudioStory模型 大语言模型生成长篇音频 文本到音频生成技术 长篇叙事音频时间连贯性 音频生成组合推理挑战
2025-08-29 12:21:29 129人关注
微软推出首批自主研发 AI 模型:挑战 OpenAI,赋能下一代 Copilot
微软人工智能部门于周四发布了首批自主研发的 AI 模型:MAI-Voice-1AI 和 MAI-1-preview。此举标志着微软在自研 AI 模型领域迈出重要一步,有望改变其对外部模型的依赖,并为未来的 Copilot 产品奠定基础。
2025-08-29 09:13:40 47人关注
面试8小时写 “Devin”,硅谷这家公司真把求职者逼到极限
在硅谷的一家公司,求职者的面试不再是简单的算法题,而是一个极具挑战性的 “创业模拟”。Cognition 的 CEO Scott Wu 近日透露,面试流程要求应聘者在8小时内从零开始复刻出公司的一款 AI 产品,类似于 “Devin”。这不仅测试技术能力,更是对抗压能力的极致考验。
AI面试新趋势 硅谷创业模拟面试 Devin AI产品复刻挑战 8小时极限编程面试 Cognition公司招聘流程 Scott Wu面试创新
2025-08-21 18:33:29 56人关注
企业已向生成式 AI投资大量资金,但95%的回报为零
尽管企业在生成式人工智能(AI)领域投入了高达300亿至400亿美元的资金,但最新的麻省理工学院(MIT)报告显示,95% 的组织并未从中获得任何回报。这一数据引发了人们对 AI 投资效果的深刻思考。