上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-08-19 18:20:29 462人关注

腾讯开源WeChat-YATT大模型训练库，破解多模态训练两大核心瓶颈

腾讯近日发布了基于Megatron-Core和SGLang/vLLM研发的大模型训练库WeChat-YATT（Yet Another Transformer Trainer），内部项目代号为gCore。这一训练库专注于强化学习和多模态模型训练，致力于为开发者提供易扩展、简洁、高效、可靠的大模型训练解决方案。

腾讯大模型训练库 WeChat-YATT训练库 gCore项目多模态模型训练强化学习模型训练 Megatron-Core应用

2025-08-15 15:12:14 327人关注

字节跳动开源 VeOmni 框架：提升多模态训练效率的新利器

近日，字节跳动宣布开源其内部开发的 VeOmni 框架，这是一款专注于多模态模型训练的统一框架。随着人工智能技术的不断发展，特别是从单一语言模型向文本、图像和视频的多模态演进，算法工程师们在训练过程中面临诸多挑战，特别是训练流程的碎片化问题。为了应对这些困扰，VeOmni 应运而生。

字节跳动开源框架 VeOmni框架多模态模型训练 AI多模态演进算法工程师训练挑战统一训练框架

2025-05-31 16:14:32 489人关注

通义开源视觉感知多模态RAG推理框架VRAG-RL

近日，通义实验室自然语言智能团队正式发布并开源了VRAG-RL——一款视觉感知驱动的多模态RAG推理框架，旨在解决在真实业务场景中，AI如何从图像、表格、设计稿等视觉语言中检索关键信息并进行精细化推理的难题。

通义VRAG RL多模态多模态模型 VRAG技术 RL多模态应用多模态模型训练

- 上云资讯 -

腾讯开源WeChat-YATT大模型训练库，破解多模态训练两大核心瓶颈

字节跳动开源 VeOmni 框架：提升多模态训练效率的新利器

通义开源视觉感知多模态RAG推理框架VRAG-RL

推荐阅读

上云服务