LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-07-16 16:20:22 94人关注

字节跳动Seed最新强化学习配方POLARIS开源 4B 模型数学推理接近 235B 表现

近日,字节跳动Seed团队携手香港大学与复旦大学,共同推出了创新的强化学习训练方法——POLARIS。该方法通过精心设计的Scaling RL策略,成功将小模型的数学推理能力提升至与超大模型相媲美的水平,为人工智能领域的小模型优化提供了新路径。

强化学习训练方法 POLARIS 算法 Scaling RL 策略 小模型数学推理能力提升 人工智能小模型优化

2025-07-10 14:38:14 100人关注

Hugging Face重磅开源SmolLM3:3B参数小模型媲美4B巨头,128K上下文引领高效AI新风潮!

近日,Hugging Face正式推出全新开源语言模型 SmolLM3,一款拥有3B参数的轻量级大语言模型(LLM),以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越同级别的Llama-3.2-3B和Qwen2.5-3B,甚至与更大规模的4B参数模型Gemma3性能相当。

Hugging Face SmolLM3 开源语言模型 轻量级大语言模型 3B参数模型 SmolLM3性能评测 SmolLM3基准测试

2025-06-28 10:35:19 61人关注

微软重磅发布设备端小模型Mu:3.3亿参数小模型 Windows11设置AI助手的智能引擎

微软正式宣布推出全新设备端小语言模型(SLM)Mu,专为Windows11的设置应用打造智能AI代理,标志着本地化AI技术在操作系统交互中的重要突破。作为一款紧凑高效的模型,Mu通过深度优化神经处理单元(NPU)运行,为用户提供低延迟、高隐私的自然语言交互体验。AIbase基于最新信息整理了Mu的亮点与行业影响,带您一探究竟。

微软SLM 设备端小语言模型 Windows11 AI代理 本地化AI技术 NPU优化AI模型 低延迟自然语言交互

2025-04-14 16:31:37 90人关注

清华与上海 AI Lab 联合打造新型过程奖励模型GenPRM,让小模型超越 GPT-4o

在人工智能领域,随着 OpenAI 的 o1和 DeepSeek 的 R1模型受到广泛关注,大语言模型(LLM)的推理能力和测试时扩展(TTS)技术引发了众多研究者的兴趣。然而,在处理复杂推理问题时,如何准确评估模型每一步的回答质量,依然是一个亟待解决的难题。为此,清华大学与上海 AI Lab 共同提出了生成式过程奖励模型(GenPRM),为过程监督推理提供了创新解决方案。

清华上海AI实验室 GenPRM GPT-4O AI大模型 大模型技术应用 AI实验室研究成果

2025-02-18 10:15:36 372人关注

小模型+大模型协同!秘塔AI搜索推出浅度研究「Shallow Research」功能

2025年2月18日,上海秘塔网络科技有限公司宣布推出其最新的研究模式——“浅度研究”(Shallow Research)。这一功能旨在通过AI技术快速收集信息并完成初步分析,帮助用户在短时间内获取有价值的研究成果。

小模型与大模型协作 Meta AI 浅析 大模型技术应用 小模型优化策略 模型协作技术研究

2025-02-15 08:18:30 90人关注

谷歌利用小模型加速 AI 训练大模型,提升 28% 效率

近年来,训练大型语言模型(LLM)变得越来越昂贵且复杂,只有少数大型科技公司具备相应的计算资源。不过,谷歌最近推出了一种名为 SALT(小模型辅助大模型训练)的新方法,这一创新可能会彻底改变 AI 训练的格局。

谷歌小模型 AI训练加速 小模型优化 AI训练效率提升 谷歌AI技术进展

2025-02-04 16:21:22 318人关注

微软正式开源超强小模型Phi-4 性能测试超越GPT-4o、Llama-3.1

微软近期在 Hugging Face 平台上发布了名为 Phi-4的小型语言模型,这款模型的参数量仅为140亿,但在多项性能测试中表现出色,超越了众多知名模型,包括 OpenAI 的 GPT-4o 及其他同类开源模型如 Qwen2.5和 Llama-3.1。

Microsoft Phi4 GPT4o LLaMA31 大模型性能对比 AI模型评测

2025-01-28 16:33:42 81人关注

广东​佛山成立 AI 小模型产业联合体

1月20日,广东佛山市举行了模界・企业 AI 应用商城发布会暨 AI 小模型产业联合体成立大会,这标志着佛山在 “AI+” 赋能新质生产力发展的探索又迈出了重要一步。

AI大模型联盟 佛山AI产业 广东人工智能联盟 AI模型技术合作 区域AI发展

2025-01-24 12:32:31 93人关注

Hugging Face 推出小巧AI模型,助力设备性能提升

近期,人工智能开发平台 Hugging Face 团队发布了两款新型 AI 模型,SmolVLM-256M 和 SmolVLM-500M。他们自信地声称,这两款模型是目前为止体积最小的 AI 模型,能够同时处理图像、短视频和文本数据,尤其适合内存少于1GB 的设备如笔记本电脑。这一创新让开发者在处理大量数据时,能够以更低的成本实现更高的效率。

Hugging Face 小模型 设备性能优化 AI模型部署 轻量级AI应用

2025-01-17 04:41:42 121人关注

可在手机运行!Hugging Face推小语言模型SmolLM 低参数表现优秀

最近,Hugging Face推出了一款全新的AI工具——SmolLM。这是一系列高性能的小型语言模型,参数从135M到1.7B不等,专门为各种设备和应用设计。想象一下,这些小模型能够在手机和笔记本电脑上高效运行,简直太酷了!

mobile-smollm hugging face AI大模型 小模型技术 模型训练技巧

2025-01-16 19:35:10 100人关注

OpenAI发布新技术PVG:用小模型验证大模型输出的准确性

OpenAI最近发布了一项名为Prover-Verifier Games(PVG)的新技术,旨在解决人工智能模型输出的“黑盒”问题。

OpenAI PVG 小模型验证 模型验证流程 PVG技术解析 OpenAI小模型应用

2025-01-16 05:26:43 147人关注

苹果开源小模型 DCLM-Baseline-7B 包括所有训练过程和素材

最近,苹果公司开源了DCLM-Baseline-7B模型,这个举动无疑将为AI语言模型的发展带来深远的影响。

Apple DCLM Baseline 7B 训练材料 大模型训练 AI 训练材料

2025-01-03 22:12:30 204人关注

Jina AI 发布革命性小模型,轻松将HTML转为优雅 Markdown!

Jina AI 推出了两款专门为将原始 HTML 内容转化为干净整洁的 Markdown 格式而设计的小型语言模型,让我们摆脱琐的网页数据处理。

Jina AI HTML转Markdown 文本格式转换工具 AI文档处理 开源技术应用

2024-12-30 14:45:38 253人关注

​新研究揭示小型 AI 语言模型在推理能力上的重大缺陷

最近,米拉研究所、谷歌 DeepMind 和微软研究院的研究人员对 AI 语言模型的推理能力进行了深入调查,发现小型和便宜的模型在解决复杂问题时存在显著不足。

小模型推理缺陷 AI小模型问题 语言模型推理错误 小模型技术缺陷 AI模型推理优化

2024-12-27 16:25:40 58人关注

Zamba2-7B:小模型,大能量,引领AI新时代

你是否曾为AI模型庞大的计算资源需求而烦恼?是否希望拥有一个既强大又高效的语言模型来提升工作效率?Zamba2-7B,这款由Zyphra团队开发的7B规模语言模型,或许能为你带来惊喜。

Zamba2-7B 小模型AI革命 AI小模型技术 小模型应用场景 AI技术发展趋势

2024-12-23 14:11:10 68人关注

英伟达AI小模型掌控人形机器人,1.5M参数完胜专业系统

英伟达研究团队近日在机器人控制领域取得重大突破。他们开发的神经网络系统HOVER,以极其精简的参数量实现了对人形机器人的高效控制,其性能甚至超越了专门设计的控制系统。

NVIDIA AI 小型模型 人形机器人 150万参数 NVIDIA AI机器人技术 NVIDIA小型模型应用

2024-12-22 12:44:25 74人关注

Hugging Face发布SmolLM2:小型语言模型挑战行业巨头

Hugging Face今天发布了SmolLM2,一组新的紧凑型语言模型,实现了令人印象深刻的性能,同时所需的计算资源比大型模型少得多。新模型采用Apache2.0许可发布,有三种大小——135M、360M和1.7B参数——适合部署在智能手机和其他处理能力和内存有限的边缘设备上。

Hugging Face SmolLM2 小语言模型 语言模型技术 小模型优化 模型训练技巧

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10