上云资讯 - 来上云吧，企业上云一站式服务

2025-11-12 11:12:40 123人关注

约翰・霍普金斯大学发布 EGO-Prompt 框架，助力小型 AI 模型实现大模型性能提升

近日，约翰・霍普金斯大学推出了一种名为 EGO-Prompt 的框架，该框架显著提高了小型语言模型在专业领域任务中的表现，性能提升近50%，同时将成本降低了83%。这一创新的框架主要用于解决专业领域任务，如医疗诊断和交通管理，使得小型 AI 模型能够媲美大型推理模型。

AI

2025-09-12 09:19:41 221人关注

全新多语种编码器 mmBERT：超越 XLM-R，提升速度与效率

近日，约翰霍普金斯大学的一组研究人员推出了 mmBERT，这是一款新型的多语种编码器，旨在填补当前多语种自然语言处理领域的空白。该模型在多个任务上超越了 XLM-R，且在速度上比以往模型提升了2到4倍，为多语种应用的研究和开发提供了更强大的支持。

多语种编码器 mmBERT模型多语种自然语言处理跨语言NLP技术多语种模型性能提升

2025-09-10 18:42:43 796人关注

80亿参数只用3亿！阿里千问3新模型推理速度暴增10倍

阿里巴巴通义千问团队刚刚向全球开发者抛出了一枚重磅炸弹，他们即将发布的Qwen3-Next-80B-A3B-Instruct模型彻底颠覆了传统大模型的运行逻辑。这个看似矛盾的数字组合背后，藏着一个令人惊叹的技术突破:总参数高达80亿，但实际激活的参数仅有3亿，就像一台超级跑车只用了十分之一的引擎却跑出了十倍的速度。

通义千问模型大模型推理优化稀疏激活技术高效AI计算 80亿参数模型 3亿激活参数模型性能提升

2025-07-30 10:18:28 888人关注

通义千问开源Qwen3-30B-A3B-Instruct-2507非思考模式模型

7月29日，Qwen3-30B-A3B模型推出了新版本Qwen3-30B-A3B-Instruct-2507。这一新版本在多个关键领域实现了显著提升，标志着该模型在非思考模式（non-thinking mode）下仅激活3B参数，就能达到与Gemini2.5-Flash(non-thinking)、GPT-4o等顶尖闭源模型相媲美的性能。

Qwen3-30B-A3B-Instruct-2507 非思考模式 3B参数激活大模型性能提升顶尖闭源模型对比

2025-07-26 12:21:12 360人关注

讯飞星火X1升级版发布：翻译、推理、文本生成能力大幅跃升！

近日，科大讯飞正式推出了升级版的星火 X1深度推理大模型，标志着国内人工智能技术的又一重大突破。此次升级不仅使星火 X1在翻译、推理、文本生成、数学等领域的综合能力实现了质的飞跃，更是将其性能提升至与国际一流模型如 OpenAI o3相媲美的水平。

科大讯飞星火 X1 深度推理大模型 AI大模型性能提升星火 X1与国际模型对比 AI大模型技术突破国内人工智能重大进展

2025-06-17 15:40:19 1852人关注

豆包大模型再进化！全球领先，AI Agent 应用加速落地！

近日，豆包大模型迎来了全新1.6版本，标志着其综合能力的再次跃升。在推理、数学、指令遵循等多个核心领域，豆包1.6实现了显著的性能提升，同时大幅降低了用户使用的门槛，推动 AI Agent 在消费电子、汽车、金融等行业的快速应用。

豆包大模型1.6 大模型性能提升 AI Agent行业应用大模型推理能力大模型数学能力指令遵循优化

2025-03-09 10:32:11 461人关注

新开普：星普大模型表现出色，算力消耗显著降低

在最近的一次机构电话交流会上，新开普公司透露了其自研的星普大模型的最新测评结果。该模型采用了 SFT（监督微调）与 RL(强化学习)的训练技术，在智能推理效果上与 DeepSeek-R1相近，且算力消耗仅为 DeepSeek-R1的1/20。这一成果不仅彰显了新开普在人工智能领域的研发实力，同时也为降低硬件投入提供了可能。

xinpu模型性能提升算力需求降低模型优化技术算力优化方案 AI模型性能改进

2025-01-28 10:44:35 523人关注

国产开源大模型 DeepSeek R1 发布，性能超越o1模、成本降90%

正文:近期，中国的 DeepSeek 团队重磅推出了其最新开源大模型 R1，受到了广泛关注。R1模型的性能表现极其出色，在多项测试中均超越了 OpenAI 的 o1模型，尤其是在数学和编程方面的评估中表现优异。

DeepSeek R1 性能优化成本降低大模型性能提升大模型成本控制

2025-01-23 13:23:33 254人关注

苹果与NVIDIA联手提升AI模型生产效率，速度提升近三倍

近日，苹果公司在机器学习领域的最新研究显示，他们通过与 NVIDIA 的合作，成功将大型语言模型（LLM）的生成速度提高了近三倍。这一进展的关键在于苹果开源的技术 “Recurrent Drafter”(ReDrafter)，它采用了一种推测解码方法，能够显著提升模型训练的效率。

AI模型效率提升 Apple与NVIDIA合作 AI模型优化技术 AI硬件加速 AI模型性能提升

2025-01-14 19:26:26 209人关注

国际奥委会：将最大限度发挥 AI 工具影响力

2024年巴黎奥运会即将迎来人工智能技术的全面应用，这场体育盛会将成为科技创新的重要舞台。国际奥委会(IOC)主席托马斯·巴赫表示，人工智能将在多个领域发挥关键作用，包括保护运动员免受网络威胁、增强广播体验和优化能源管理。

AI大模型 IOC技术应用 AI影响力最大化 AI技术优化 AI模型性能提升

2025-01-14 00:42:14 267人关注

Zyphra推小语言模型Zamba2-2.7B：速度提高一倍，内存成本降低27%

最近，Zyphra 公司发布了全新的 Zamba2-2.7B 语言模型，这一发布在小型语言模型的发展史上具有重要意义。新模型在性能和效率方面取得了显著提升，它的训练数据集达到了大约3万亿个标记，这使得它在性能上可以与 Zamba1-7B 及其他领先的7B 模型相媲美。

Zyphra Zamba2 2.7B 模型速度优化内存成本优化 AI模型性能提升轻量级大模型应用

2024-12-28 15:40:11 301人关注

创新开源框架OpenR 有效提升大模型推理能力

一个名为OpenR的创新开源框架近日问世，旨在解决大型语言模型（LLMs）在复杂推理任务中的短板。这一由伦敦大学学院、利物浦大学、上海交通大学、香港科技大学(广州)和西湖大学研究人员联合开发的框架，通过结合测试时计算、强化学习和过程监督，为提升LLMs的推理能力开辟了新途径。

OpenR框架大模型推理优化大模型推理加速 OpenR框架应用大模型性能提升

2024-12-25 03:24:43 303人关注

Meta AI新量化版本Llama 3.2：速度提高2倍、体量减少56%，手机就能运行

最近，Meta AI 推出了全新的量化 Llama3.2模型，包含1B 和3B 两个版本，这款模型可以在多种设备上进行微调、蒸馏和部署。

Meta AI Llama 3 AI大模型大模型优化技术移动端AI加速模型性能提升

2024-12-11 03:27:22 377人关注

突破性能瓶颈：Crawl4 AI v0.4.1发布，爬取效率提升至4倍

开源网络爬虫项目Crawl4 AI近日发布了v0.4. 1 版本，带来多项重大更新。最引人注目的是新增的文本模式（Text-Only Mode）功能，该模式通过优化资源加载策略，将爬取效率提升至原来的3- 4 倍。

AI大模型 AI模型效率提升 AI模型优化 AI模型性能提升 AI模型效率优化

- 上云资讯 -

约翰・霍普金斯大学发布 EGO-Prompt 框架，助力小型 AI 模型实现大模型性能提升

全新多语种编码器 mmBERT：超越 XLM-R，提升速度与效率

80亿参数只用3亿！阿里千问3新模型推理速度暴增10倍

通义千问开源Qwen3-30B-A3B-Instruct-2507非思考模式模型

讯飞星火X1升级版发布：翻译、推理、文本生成能力大幅跃升！

豆包大模型再进化！全球领先，AI Agent 应用加速落地！

新开普：星普大模型表现出色，算力消耗显著降低

国产开源大模型 DeepSeek R1 发布，性能超越o1模、成本降90%

苹果与NVIDIA联手提升AI模型生产效率，速度提升近三倍

国际奥委会：将最大限度发挥 AI 工具影响力

Zyphra推小语言模型Zamba2-2.7B：速度提高一倍，内存成本降低27%

创新开源框架OpenR 有效提升大模型推理能力

Meta AI新量化版本Llama 3.2：速度提高2倍、体量减少56%，手机就能运行

突破性能瓶颈：Crawl4 AI v0.4.1发布，爬取效率提升至4倍

推荐阅读

上云服务

- 上云资讯 -

​约翰・霍普金斯大学发布 EGO-Prompt 框架，助力小型 AI 模型实现大模型性能提升

全新多语种编码器 mmBERT：超越 XLM-R，提升速度与效率

80亿参数只用3亿！阿里千问3新模型推理速度暴增10倍

通义千问开源Qwen3-30B-A3B-Instruct-2507非思考模式模型

讯飞星火X1升级版发布：翻译、推理、文本生成能力大幅跃升！

豆包大模型再进化！全球领先，AI Agent 应用加速落地！

新开普：星普大模型表现出色，算力消耗显著降低

​国产开源大模型 DeepSeek R1 发布，性能超越o1模、成本降90%

苹果与NVIDIA联手提升AI模型生产效率，速度提升近三倍

国际奥委会：将最大限度发挥 AI 工具影响力

Zyphra推小语言模型Zamba2-2.7B： 速度提高一倍，内存成本降低27%

创新开源框架OpenR 有效提升大模型推理能力

Meta AI新量化版本Llama 3.2：速度提高2倍、体量减少56%，手机就能运行

突破性能瓶颈：Crawl4 AI v0.4.1发布，爬取效率提升至4倍

推荐阅读

上云服务

约翰・霍普金斯大学发布 EGO-Prompt 框架，助力小型 AI 模型实现大模型性能提升

国产开源大模型 DeepSeek R1 发布，性能超越o1模、成本降90%

Zyphra推小语言模型Zamba2-2.7B：速度提高一倍，内存成本降低27%