LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-07-14 12:16:25 232人关注

重磅发布!月之暗面推出万亿参数开源大模型Kimi K2

中国人工智能企业月之暗面近日重磅推出其最新的开源大语言模型 ——Kimi K2。这一模型采用了混合专家架构,总参数量达到了惊人的1万亿,其中激活参数为320亿,表现出色,成为业内关注的焦点。

月之暗面 Kimi K2开源大模型 万亿参数大模型 混合专家架构 大语言模型技术突破 中国AI企业创新

2025-04-18 14:41:38 87人关注

微软开源 OmniParser V2:让大语言模型“看懂”并操作 GUI

微软近日推出了其 Windows 操作大模型 OmniParser 的升级版本——OmniParser-v2.0。该模型能够识别桌面和窗口元素,并与之进行交互,标志着 AI Agent 技术在实现完全自动使用电脑的方向上又迈进了一步。

Microsoft OmniParser V2 GUI语言模型 语言模型技术 OmniParser V2新特性 Microsoft AI工具

2025-04-05 14:39:28 103人关注

研究警告AI语言模型极限:超8K上下文性能腰斩,概念推理成难关

慕尼黑大学、慕尼黑机器学习中心与Adobe Research近日联合发布的研究显示,包括GPT-4o、Gemini1.5Pro和Llama-3.3-70B在内的12款顶尖AI语言模型,在长文本概念推理任务中面临显著性能衰减。尽管这些模型均支持至少128,000个标记的上下文处理,但其深层逻辑关联能力仍存在根本性局限。

AI语言模型 上下文性能 概念推理 AI模型性能优化 语言模型技术原理

2025-02-09 12:41:34 113人关注

Meta 提出新型可扩展记忆层,提升语言模型知识储备、减少幻觉现象

随着企业越来越多地应用大型语言模型(LLMs),如何提升模型的知识准确性并减少幻觉现象,成为了一项重要挑战。Meta AI 的研究人员在一篇新论文中提出了 “可扩展记忆层”,或许能够为这一问题提供解决方案。

meta语言模型 可扩展内存层 大语言模型技术 内存层优化技术 语言模型内存架构

2025-01-28 08:11:33 123人关注

​MIT、 DeepMind研究揭示视觉语言模型无法理解否定表达的原因

在多模态任务中,视觉语言模型(VLMs)起着至关重要的作用,如图像检索、图像说明和医学诊断等。这些模型的目标是将视觉数据与语言数据进行对齐,以实现更高效的信息处理。然而,目前的 VLMs 在理解否定方面仍面临重大挑战。

MIT DeepMind VLM 视觉语言模型 否定理解 人工智能研究 视觉语言模型技术

2025-01-22 05:39:19 824人关注

DeepSeek-AI开源DeepSeek-VL2系列:3B、16B 和27B参数三种模型

随着人工智能的快速发展,视觉与语言能力的整合引发了视觉语言模型(VLMs)的突破性进展。这些模型旨在同时处理和理解视觉与文本数据,广泛应用于图像描述、视觉问答、光学字符识别以及多模态内容分析等场景。

DeepSeek VL2 3B模型 16B模型 27B模型 大语言模型技术 多模态AI模型

2025-01-03 09:26:15 71人关注

无标记化的语言模型T-FREE 像施了魔法一样高效!

研究团队最近带来了一个令人兴奋的新方法,叫做 T-FREE,让大型语言模型的运作效率直线上升。来自 Aleph Alpha、达姆施塔特工业大学、hessian.AI 和德国人工智能研究中心(DFKI)的科学家们联合推出了这个令人惊叹的技术,它的全名是 “无需标记器的稀疏表示,可实现内存高效嵌入”。

高效语言模型 免费语言模型 语言模型技术 语言模型应用场景 语言模型优化技巧

2024-12-30 19:33:18 154人关注

​富士通推出 Takane 大型语言模型,助力企业智能化升级

最近,富士通正式发布了名为 “Takane” 的大型语言模型(LLM),这款模型特别为企业用户打造,旨在满足安全私密环境下的需求。

Fujitsu 大语言模型 Takane LLM Fujitsu大语言模型技术 Takane大模型应用

2024-12-30 12:26:37 106人关注

​谷歌推出 Gemma-2-JPN:一款针对日本市场的先进 AI 语言模型

近日,谷歌宣布推出一款名为 “gemma-2-2b-jpn-it” 的新模型,这是其 Gemma 系列语言模型的最新成员。这个模型专门针对日本语言进行优化,展示了谷歌在大型语言模型(LLM)领域持续投入的决心。

Google Gemma 2 日语AI语言模型 AI大模型 语言模型技术 Google AI新成果 日语自然语言处理

2024-12-22 12:44:25 74人关注

Hugging Face发布SmolLM2:小型语言模型挑战行业巨头

Hugging Face今天发布了SmolLM2,一组新的紧凑型语言模型,实现了令人印象深刻的性能,同时所需的计算资源比大型模型少得多。新模型采用Apache2.0许可发布,有三种大小——135M、360M和1.7B参数——适合部署在智能手机和其他处理能力和内存有限的边缘设备上。

Hugging Face SmolLM2 小语言模型 语言模型技术 小模型优化 模型训练技巧

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10