上云资讯 - 来上云吧，企业上云一站式服务

2025-01-17 18:11:15 277人关注

大语言模型推理能力被高估了在不熟悉场景中有很大的弱点

近期，麻省理工学院（MIT）的研究团队对大型语言模型(LLMs)进行了深入的研究，探讨它们在不同任务下的表现。他们发现，尽管这些模型在一些常见的任务上看起来很出色，但实际上它们的推理能力常常被高估，尤其是在面对不熟悉的情境时。

2025-01-07 04:33:26 559人关注

阿里巴巴的云计算部门刚刚发布了一款全新的 AI 模型 ——Qwen2-VL。这款模型的强大之处在于它能够理解视觉内容，包括图片和视频，甚至可以实时分析长达20分钟的视频，可以说相当强悍。

2025-01-03 09:26:15 253人关注

研究团队最近带来了一个令人兴奋的新方法，叫做 T-FREE，让大型语言模型的运作效率直线上升。来自 Aleph Alpha、达姆施塔特工业大学、hessian.AI 和德国人工智能研究中心（DFKI）的科学家们联合推出了这个令人惊叹的技术，它的全名是 “无需标记器的稀疏表示，可实现内存高效嵌入”。

2024-12-26 19:13:39 355人关注

Meta AI 最新推出的 SPIRIT-LM 是一款具有革命性意义的多模态基础语言模型，它能够自由混合文本和语音，并能像人类一样理解和表达情感。