上云资讯 - 来上云吧，企业上云一站式服务

2025-05-14 16:28:27 390人关注

字节跳动发布新一代多模态大模型，挑战谷歌 Gemini 2.5 Pro

在人工智能领域竞争日益激烈的今天，字节跳动的 Seed 团队于5月13日正式发布了其最新的多模态大模型 Seed1.5-VL，旨在为智能体技术的进步铺平道路。该模型经过超过3万亿 tokens 的多模态数据预训练，不仅具备强大的通用多模态理解和推理能力，还显著降低了推理成本。

2025-01-18 19:19:24 491人关注

港大与腾讯的研究人员提出了一种全新的多模态推荐系统范式 ——DiffMM，旨在提高短视频推荐的精准度。该系统通过创建一个包含用户和视频信息的图，并利用图扩散和对比学习技术，更好地理解用户和视频之间的关系，从而实现更准确的推荐。

2025-01-05 01:23:26 604人关注

在人工智能快速发展的今天，一款名为Mini-Omni的开源多模态大型语言模型正在引领语音交互技术的革新。这个由多个先进技术集成而成的AI系统，不仅能够实现实时的语音输入和输出，还具备"边思考边说话"的独特能力，为用户带来前所未有的自然交互体验。

2024-12-31 14:32:17 383人关注

在人工智能的浩瀚海洋中，一艘名为Emu3的创新之船正在破浪前行，为我们展示了多模态AI的无限可能。这个由Meta AI研究团队开发的革命性模型，通过简单而巧妙的"下一步预测"机制，实现了文本、图像和视频的统一处理。

2024-12-29 17:35:19 205人关注

今日，科大讯飞宣布，2024科大讯飞全球1024开发者节将于10月24日开幕。