- 上云资讯 -
2025-01-27 08:30:43 85人关注
阿里巴巴达摩院推出电商场景多模态大模型Valley 2
阿里巴巴达摩院近日推出了一款名为Valley2的多模态大型语言模型,该模型基于电商场景设计,旨在通过可扩展的视觉-语言架构,提升各领域性能并拓展电商与短视频场景的应用边界。Valley2采用了Qwen2.5作为LLM主干,搭配SigLIP-384视觉编码器,结合MLP层和卷积进行高效特征转换。其创新之处在于引入了大视觉词汇、卷积适配器(ConvAdapter)和Eagle模块,增强了处理多样化真实世界输入的灵活性及训练推理效率。
2025-01-18 17:30:39 41人关注
达摩院“寻光”炸场!可控编辑,轻松搞定AI视频工作流
AI视频创作领域迎来了一场革命性的变革,由阿里达摩院推出的“寻光”平台在WAIC上震撼亮相。这不仅仅是一个技术演示,而是一个即将开放内测、供创作者使用的一站式AI视频创作平台。它将剧本创作、分镜图设计、视频素材编辑等多个制作流程整合在一个平台上,让视频创作变得前所未有的简单和高效。
2024-12-26 17:28:25 35人关注
表格、图表统统拿下!阿里达摩院开源DocOwl 1.5 无需OCR,高效“读懂”文档!
阿里巴巴达摩院与中国人民大学近日联合开源了一款名为 mPLUG-DocOwl1.5的文档处理模型,该模型主打无需 OCR 识别即可理解文档内容,并在多个视觉文档理解基准测试中取得了领先的性能。
2024-12-25 14:42:41 53人关注
阿里巴巴达摩院开源CoI-Agent:一键生成科研idea的AI研究助手
阿里巴巴达摩院最近开源了一款名为CoI-Agent的AI工具,可以帮助科研人员自动生成科研idea。这个工具可以根据输入的论文主题,快速生成相关的科研idea,帮助科研人员节省时间和提高效率。
2024-12-21 23:45:34 96人关注
阿里达摩院推出八观气象大模型:新能源电力预测准确率突破96%
今日,阿里巴巴达摩院在北京举行了决策智能产品发布会,正式推出了八观气象大模型。这一模型在全球气象模型的基础上,结合了区域多源数据,能够实现时空精度最高达到1公里 ×1公里和1小时。