- 上云资讯 -
2025-07-19 11:23:11 41人关注
苹果低头向英伟达妥协!MLX 框架支持 CUDA,AI领域竞争加剧
苹果公司最近做出了一项颇具分量的决定,主动为其专为端侧 AI 模型训练推出的 MLX 框架增加了对英伟达 CUDA 的支持。这一消息一经传出,便在科技社区引发了热烈讨论,显示出苹果在面对英伟达强大生态时的不得已之举。
2025-07-12 11:40:34 50人关注
AWS 在 AI 竞争中加码基础设施,SageMaker 平台迎来重大升级
亚马逊网络服务(AWS)对其机器学习和 AI 模型训练与推理平台 SageMaker 进行了重磅升级,旨在提升用户体验并增强其市场竞争力。这一升级增加了新型可观察性功能、连接编码环境以及 GPU 集群性能管理等多项新特性。
AWS SageMaker升级 机器学习平台新特性 AI模型训练平台 GPU集群性能管理 SageMaker可观察性功能
2025-07-05 10:15:30 47人关注
日立能源警告:AI 中心的电力需求波动可能威胁全球电力供应稳定
近日,世界最大变压器制造商日立能源的首席执行官安德烈亚斯・施里伦贝克(Andreas Schierenbeck)在接受《金融时报》采访时指出,随着大科技公司在训练人工智能模型时电力需求的激增,政府需要采取措施来限制这种波动,以确保电力供应的稳定。
2025-06-26 10:13:19 39人关注
微软因未经授权使用盗版书籍训练 AI 面临版权诉讼
近日,微软公司遭到多位知名作家的控告,指控其在训练人工智能模型 Megatron 时,未经许可使用了大量盗版书籍。起诉的作家包括凯・伯德、贾・托连蒂诺和丹尼尔・奥克伦特等,他们在纽约联邦法院提出诉讼,认为微软利用他们作品的盗版电子版进行 AI 训练,从而使 AI 能够根据用户的文本指令生成回应。
微软AI侵权案 AI训练数据版权争议 AI盗版书籍诉讼 微软Megatron侵权纠纷 作家控告AI侵权 AI模型训练法律风险
2025-06-25 10:13:27 83人关注
加州法院裁定使用版权内容训练 AI 合规,引发创作者担忧
美国加州北区地方法院作出了一项重要裁决,允许使用受版权保护的作品来训练人工智能模型。这个决定引发了广泛的关注和争议,尤其是在创意产业中,许多艺术家和内容创作者对此表示担忧。裁决支持了被告 Anthropic 公司在没有授权的情况下使用盗版材料来训练其 AI 模型 Claude,进一步引发了关于创作者权益的讨论。
AI模型训练版权争议 美国AI版权裁决 Anthropic公司版权诉讼 AI训练数据合法性 创作者权益保护 Claude AI模型版权问题
2025-06-20 10:17:26 120人关注
视频成本更低!MiniMax Hailuo 02用户基准测试中超越Google Veo 3
近日,MiniMax 推出了其视频人工智能模型 Hailuo02的第二代版本,带来了性能和价格上的重大升级。这款新模型采用了一种名为噪声感知计算重分配(NCR)的架构,MiniMax 声称这一技术在训练和推理效率方面提高了2.5倍。NCR 架构在处理长视频序列时,根据训练阶段的不同采用了不同的方法。在训练初期,数据中人工噪声被大量引入,视频被尽可能压缩;而当训练到视频更清晰的阶段时,模型则以全分辨率进行处理。
2025-05-27 12:37:31 97人关注
Anthropic称Claude 3.7 Sonnet训练成本数千万美元,远低于部分竞品
近日,沃顿商学院教授伊桑·莫里克透露了Anthropic公司相关信息。他表示Anthropic公关部门澄清,旗舰AI模型Claude3.7Sonnet的训练成本为“数千万美元”,且使用的计算能力不到10^26FLOP。他还提到Anthropic告知他Sonnet3.7不会被视为10^26FLOP模型,不过未来模型规模会大得多。TechCrunch虽联系Anthropic确认但截至发稿未收到回复。
Anthropic Claude Claude Sonnet AI模型训练成本 大模型训练费用 Anthropic模型训练 AI技术成本分析
2025-02-19 14:36:36 101人关注
哈佛大学华人研究员Jeffrey Wang加盟OpenAI 专注模型预训练和推理工作
近日,哈佛大学的华人研究员 Jeffrey Wang 正式加入了 OpenAI,担任基础团队的研究员,专注于模型预训练和推理工作。这一消息引发了广泛关注,OpenAI 的联合创始人兼总裁 Greg Brockman 也在第一时间对 Jeffrey 的加入表示热烈欢迎。
2025-01-20 01:32:19 124人关注
为训练AI模型Adobe偷偷修改服务条款 海内外博主发声抵制
Adobe,一个在创意产业中享有盛誉的名字,因其版权保护的立场而被誉为“版权卫士”。但最近,这家公司却因为一项悄悄更新的服务条款而陷入了舆论的漩涡。
2025-01-19 22:21:44 88人关注
北大等提出医疗专家模型训练方法 将8B模型提升至GPT-4级性能
北大和香港科技大学的团队搞了个大新闻,他们提出了一种训练方法,让8B尺寸的医疗专家模型达到了GPT-4级的性能。这可不是小打小闹,他们还引入了一个新概念——「稳定性差距」,来解释大语言模型在持续预训练过程中出现的一些现象。
2025-01-18 03:35:35 147人关注
DeepMind新方法JEST提升AI训练:时间缩减13倍,算力降低90%
在人工智能领域,算力和时间一直是制约技术进步的关键因素。然而,DeepMind团队的最新研究成果,为这一难题提供了解决方案。
2025-01-14 16:34:22 293人关注
Llama 4启动训练 Meta科学家揭秘Llama 3.1训练背后的故事
Meta的科学家Thomas Scialom在播客节目Latent Space中,为我们揭开了Llama3.1的研发秘籍,并提前透露了Llama4的神秘面纱。
2025-01-14 13:22:18 92人关注
Llama 3.1训练故障频发:1.6万块H100每3小时故障1次 GPU和HBM3显存是关键!
在人工智能的世界里,每一次突破都伴随着令人瞠目结舌的数据。想象一下,16384块GPU同时运转,这不是科幻电影里的场景,而是Meta公司在训练最新Llama3.1模型时的真实写照。然而,在这场技术盛宴的背后,隐藏着平均每3小时就会发生一次的故障。这个惊人的数字,不仅展示了AI发展的速度,也暴露了当前技术面临的巨大挑战。
2025-01-13 14:14:11 156人关注
Claude团队因数据抓取问题引众怒 为绕开规则不择手段
在数据驱动的AI时代,获取大量数据已成为训练强大模型的关键。然而,获取数据的方式却引发了争议。最近,Claude团队因不当的数据抓取行为而激起了众怒。
2025-01-12 18:20:44 79人关注
英伟达被曝秘密抓取 YouTube 视频数据训练AI
最近,科技巨头英伟达在数据获取方面的一项秘密行动被曝光。根据媒体404的报道,英伟达通过抓取海量 YouTube 视频数据来训练他们的人工智能模型,这一行为在法律和伦理上都相当模糊。
2025-01-10 03:41:37 80人关注
英伟达开源新突破:新模型训练算力节省1.8倍!
全球人工智能的领军企业英伟达(Nvidia)最近开源了两款新型大模型:Nemotron-4-Minitron-4B和Nemotron-4-Minitron-8B。这两个模型的开源,不仅是技术上的一次飞跃,更在AI领域掀起了一场效率革命。