- 上云资讯 -
2025-01-27 08:30:43 84人关注
阿里巴巴达摩院推出电商场景多模态大模型Valley 2
阿里巴巴达摩院近日推出了一款名为Valley2的多模态大型语言模型,该模型基于电商场景设计,旨在通过可扩展的视觉-语言架构,提升各领域性能并拓展电商与短视频场景的应用边界。Valley2采用了Qwen2.5作为LLM主干,搭配SigLIP-384视觉编码器,结合MLP层和卷积进行高效特征转换。其创新之处在于引入了大视觉词汇、卷积适配器(ConvAdapter)和Eagle模块,增强了处理多样化真实世界输入的灵活性及训练推理效率。
2024-12-25 14:42:41 53人关注
阿里巴巴达摩院开源CoI-Agent:一键生成科研idea的AI研究助手
阿里巴巴达摩院最近开源了一款名为CoI-Agent的AI工具,可以帮助科研人员自动生成科研idea。这个工具可以根据输入的论文主题,快速生成相关的科研idea,帮助科研人员节省时间和提高效率。