微信扫码
添加专属顾问
2025-01-17 18:11:15 125人关注
近期,麻省理工学院(MIT)的研究团队对大型语言模型(LLMs)进行了深入的研究,探讨它们在不同任务下的表现。他们发现,尽管这些模型在一些常见的任务上看起来很出色,但实际上它们的推理能力常常被高估,尤其是在面对不熟悉的情境时。
大语言模型 语言模型弱点 语言模型评估 语言模型应用场景 语言模型性能
2025-01-07 04:33:26 256人关注
阿里巴巴的云计算部门刚刚发布了一款全新的 AI 模型 ——Qwen2-VL。这款模型的强大之处在于它能够理解视觉内容,包括图片和视频,甚至可以实时分析长达20分钟的视频,可以说相当强悍。
阿里通义千问2.0视觉语言模型 通义千问VL模型 Qwen2-VL技术解析 阿里巴巴AI大模型 视觉语言模型应用场景
2025-01-03 09:26:15 72人关注
研究团队最近带来了一个令人兴奋的新方法,叫做 T-FREE,让大型语言模型的运作效率直线上升。来自 Aleph Alpha、达姆施塔特工业大学、hessian.AI 和德国人工智能研究中心(DFKI)的科学家们联合推出了这个令人惊叹的技术,它的全名是 “无需标记器的稀疏表示,可实现内存高效嵌入”。
高效语言模型 免费语言模型 语言模型技术 语言模型应用场景 语言模型优化技巧
2024-12-26 19:13:39 127人关注
Meta AI 最新推出的 SPIRIT-LM 是一款具有革命性意义的多模态基础语言模型,它能够自由混合文本和语音,并能像人类一样理解和表达情感。
情感AI语言模型 Meta Spirit LM AI大模型 情感计算技术 语言模型应用场景 AI情感交互