LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-05-14 16:28:27 135人关注

字节跳动发布新一代多模态大模型,挑战谷歌 Gemini 2.5 Pro

在人工智能领域竞争日益激烈的今天,字节跳动的 Seed 团队于5月13日正式发布了其最新的多模态大模型 Seed1.5-VL,旨在为智能体技术的进步铺平道路。该模型经过超过3万亿 tokens 的多模态数据预训练,不仅具备强大的通用多模态理解和推理能力,还显著降低了推理成本。

字节跳动 多模态模型 Gemini AI大模型 多模态技术应用

2025-01-18 19:19:24 190人关注

新颖多模态推荐系统范式DiffMM,让扩散模型也能推荐短视频!

港大与腾讯的研究人员提出了一种全新的多模态推荐系统范式 ——DiffMM,旨在提高短视频推荐的精准度。该系统通过创建一个包含用户和视频信息的图,并利用图扩散和对比学习技术,更好地理解用户和视频之间的关系,从而实现更准确的推荐。

多模态推荐系统 推荐系统技术 多模态技术应用 DiffMM 推荐系统 推荐系统创新

2025-01-05 01:23:26 259人关注

Mini-Omni:开启"边思考边说话"新时代的多模态AI模型

在人工智能快速发展的今天,一款名为Mini-Omni的开源多模态大型语言模型正在引领语音交互技术的革新。这个由多个先进技术集成而成的AI系统,不仅能够实现实时的语音输入和输出,还具备"边思考边说话"的独特能力,为用户带来前所未有的自然交互体验。

多模态AI模型 Omni模型 AI模型技术 多模态技术应用 AI模型最新动态

2024-12-31 14:32:17 183人关注

超牛多模态模型Emu3:通过预测下一个词的方式理解图像、视频

在人工智能的浩瀚海洋中,一艘名为Emu3的创新之船正在破浪前行,为我们展示了多模态AI的无限可能。这个由Meta AI研究团队开发的革命性模型,通过简单而巧妙的"下一步预测"机制,实现了文本、图像和视频的统一处理。

EMU3 多模态模型 下一个词预测 AI大模型 多模态技术应用 EMU3模型架构

2024-12-29 17:35:19 90人关注

科大讯飞:将于10月24日发布多模态视觉交互技术

今日,科大讯飞宣布,2024科大讯飞全球1024开发者节将于10月24日开幕。

讯飞多模态视觉交互技术 多模态视觉交互 视觉交互技术 讯飞视觉交互 多模态技术应用

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10