LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-08-19 18:20:29 197人关注

腾讯开源WeChat-YATT大模型训练库,破解多模态训练两大核心瓶颈

腾讯近日发布了基于Megatron-Core和SGLang/vLLM研发的大模型训练库WeChat-YATT(Yet Another Transformer Trainer),内部项目代号为gCore。这一训练库专注于强化学习和多模态模型训练,致力于为开发者提供易扩展、简洁、高效、可靠的大模型训练解决方案。

腾讯大模型训练库 WeChat-YATT训练库 gCore项目 多模态模型训练 强化学习模型训练 Megatron-Core应用

2025-08-15 15:12:14 97人关注

字节跳动开源 VeOmni 框架:提升多模态训练效率的新利器

近日,字节跳动宣布开源其内部开发的 VeOmni 框架,这是一款专注于多模态模型训练的统一框架。随着人工智能技术的不断发展,特别是从单一语言模型向文本、图像和视频的多模态演进,算法工程师们在训练过程中面临诸多挑战,特别是训练流程的碎片化问题。为了应对这些困扰,VeOmni 应运而生。

字节跳动开源框架 VeOmni框架 多模态模型训练 AI多模态演进 算法工程师训练挑战 统一训练框架

2025-05-31 16:14:32 240人关注

通义开源视觉感知多模态RAG推理框架VRAG-RL

近日,通义实验室自然语言智能团队正式发布并开源了VRAG-RL——一款视觉感知驱动的多模态RAG推理框架,旨在解决在真实业务场景中,AI如何从图像、表格、设计稿等视觉语言中检索关键信息并进行精细化推理的难题。

通义VRAG RL多模态 多模态模型 VRAG技术 RL多模态应用 多模态模型训练

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10