- 上云资讯 -
2025-08-26 15:35:23 110人关注
谷歌推出新方法:训练数据量减少 1 万倍,提升模型精准度
近日,谷歌在其研究中提出了一种新颖的主动学习筛选流程,旨在大幅降低微调大型语言模型所需的训练数据量。根据实验结果,这种方法能够将训练数据量降低至原来的1万分之一,同时提高模型与人类专家判断的一致性达65%。在实际应用中,如广告内容分类、金融数据安全分析等领域,对高保真训练数据的需求一直很高,但筛选出符合要求的数据不仅难度大,成本也极为昂贵。
主动学习筛选流程 微调大模型训练数据优化 高保真训练数据筛选 广告内容分类模型微调 金融数据安全分析模型训练 降低大模型训练成本
2025-08-19 18:20:29 197人关注
腾讯开源WeChat-YATT大模型训练库,破解多模态训练两大核心瓶颈
腾讯近日发布了基于Megatron-Core和SGLang/vLLM研发的大模型训练库WeChat-YATT(Yet Another Transformer Trainer),内部项目代号为gCore。这一训练库专注于强化学习和多模态模型训练,致力于为开发者提供易扩展、简洁、高效、可靠的大模型训练解决方案。
腾讯大模型训练库 WeChat-YATT训练库 gCore项目 多模态模型训练 强化学习模型训练 Megatron-Core应用
2025-08-16 11:22:19 105人关注
AI大模型的版权风暴:行业巨头面临7500亿美元赔偿风险
近年来,随着人工智能技术的飞速发展,大型 AI 模型的训练数据来源问题日益成为业界关注的焦点。许多知名企业在构建其 AI 模型时,似乎都选择了使用大量未授权的版权内容作为数据。这一 “秘密配方” 引发了激烈的法律争论,并将硅谷的科技巨头们推上了风口浪尖。
2025-07-22 14:33:25 69人关注
蚂蚁数科AI数据产业基地正式投产,携手苏州推进AI产业落地
近日,蚂蚁数科AI数据产业基地在太仓智汇谷·科技创新园正式投产。该基地作为苏州市首个AI数据产业基地,旨在通过跨行业人才与前沿技术,为长三角制造业、金融、医疗等领域的大模型落地提供场景化、高质量的训练数据支撑。
2025-05-27 12:37:31 133人关注
Anthropic称Claude 3.7 Sonnet训练成本数千万美元,远低于部分竞品
近日,沃顿商学院教授伊桑·莫里克透露了Anthropic公司相关信息。他表示Anthropic公关部门澄清,旗舰AI模型Claude3.7Sonnet的训练成本为“数千万美元”,且使用的计算能力不到10^26FLOP。他还提到Anthropic告知他Sonnet3.7不会被视为10^26FLOP模型,不过未来模型规模会大得多。TechCrunch虽联系Anthropic确认但截至发稿未收到回复。
Anthropic Claude Claude Sonnet AI模型训练成本 大模型训练费用 Anthropic模型训练 AI技术成本分析
2025-04-26 18:31:24 137人关注
马斯克首次披露 Grok 3 的训练成本:高达 20 万块英伟达 GPU
近日,马斯克在直播中正式推出了全新的聊天机器人 Grok3,并透露了该模型训练的惊人成本。Grok3目前已面向 Premium + 订阅用户开放,并在多个评测领域表现出色,甚至超过了市场上其他竞争对手,如 Gemini、DeepSeek 和 ChatGPT。
2025-03-18 16:21:37 136人关注
潞晨科技推全新开源视频模型Open-Sora 2.0 训练流程全开源
还在为动辄百万美金的视频生成模型望而却步?还在感叹AI视频创作只是巨头的游戏?今天,开源社区用实力告诉你: “No!” 一款名为 Open-Sora2.0的全新开源模型横空出世,彻底颠覆了视频生成的“氪金”规则。 难以置信的是,这款性能直逼商业级水准的110亿参数大模型,竟然只花费了区区20万美元(224张GPU)就训练成功! 要知道,那些动辄耗资数百万美元的闭源模型,在 Open-Sora2.0面前,性价比简直弱爆了!
OpenAI Sora 2.0 OpenAI Sora 训练 AI大模型训练 AI视频生成技术 OpenAI Sora 2.0 技术解析
2025-03-05 10:17:44 152人关注
vivo重组调整,成立新AI部门并将大模型训练转向端侧
近日,vivo 公司在其组织架构上进行了重要调整,宣布在原有的 OS 产品领域内新设立 AI 领域。这一新部门下将包括人工智能一部和人工智能二部,标志着 vivo 在人工智能技术上的持续投入和战略布局。此次变动还伴随着高层人事调整,原互联网平台运营领域的总经理张飞被任命为新 AI 领域的总经理,并兼任人工智能一部的负责人,直接向公司副总裁、OS 产品领域负责人周围汇报。
2025-02-16 10:28:35 209人关注
多家知名出版商起诉AI初创公司Cohere涉嫌侵犯版权
近日,包括康泰纳仕(Condé Nast)、《大西洋月刊》(The Atlantic)和《福布斯》(Forbes)在内的14家出版商联合起诉 AI 初创公司 Cohere,指控其存在 “系统性” 的版权侵犯行为。
2025-02-15 16:33:25 238人关注
谷歌 DeepMind 推出千亿级视觉语言数据集 WebLI-100B
谷歌 DeepMind 团队正式推出了 WebLI-100B 数据集,这是一个包含1000亿个图像 - 文本对的庞大数据集,旨在增强人工智能视觉语言模型的文化多样性和多语言性。通过这一数据集,研究人员希望改善视觉语言模型在不同文化和语言环境下的表现,同时减少各个子组之间的性能差异,从而提升人工智能的包容性。
2025-01-21 17:41:31 242人关注
哈佛大学发布千万级书籍数据集 为AI模型提供高质量训练材料
哈佛大学近日宣布,计划发布一个由近100万本公共领域书籍组成的数据集,任何人都可以使用该数据集来训练大型语言模型和其他人工智能工具。
2025-01-19 20:43:23 146人关注
马斯克:训练Grok-3用了10万块NVIDIA H100 会很特别
马斯克近日宣布其人工智能初创公司xAI即将在八月推出其革新性大语言模型——Grok-2,预示着更加先进的人工智能功能即将面世。尽管Grok-2尚未揭开神秘面纱,但马斯克已迫不及待地为后续力作Grok-3预热。
Musk训练Grok 3 100k Nvidia H100 Grok 3训练细节 Nvidia H100应用 AI大模型训练技术