- 上云资讯 -
2025-07-16 16:20:22 94人关注
字节跳动Seed最新强化学习配方POLARIS开源 4B 模型数学推理接近 235B 表现
近日,字节跳动Seed团队携手香港大学与复旦大学,共同推出了创新的强化学习训练方法——POLARIS。该方法通过精心设计的Scaling RL策略,成功将小模型的数学推理能力提升至与超大模型相媲美的水平,为人工智能领域的小模型优化提供了新路径。
2025-07-10 14:38:14 100人关注
Hugging Face重磅开源SmolLM3:3B参数小模型媲美4B巨头,128K上下文引领高效AI新风潮!
近日,Hugging Face正式推出全新开源语言模型 SmolLM3,一款拥有3B参数的轻量级大语言模型(LLM),以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越同级别的Llama-3.2-3B和Qwen2.5-3B,甚至与更大规模的4B参数模型Gemma3性能相当。
Hugging Face SmolLM3 开源语言模型 轻量级大语言模型 3B参数模型 SmolLM3性能评测 SmolLM3基准测试
2025-04-14 16:31:37 90人关注
清华与上海 AI Lab 联合打造新型过程奖励模型GenPRM,让小模型超越 GPT-4o
在人工智能领域,随着 OpenAI 的 o1和 DeepSeek 的 R1模型受到广泛关注,大语言模型(LLM)的推理能力和测试时扩展(TTS)技术引发了众多研究者的兴趣。然而,在处理复杂推理问题时,如何准确评估模型每一步的回答质量,依然是一个亟待解决的难题。为此,清华大学与上海 AI Lab 共同提出了生成式过程奖励模型(GenPRM),为过程监督推理提供了创新解决方案。
2025-02-18 10:15:36 372人关注
小模型+大模型协同!秘塔AI搜索推出浅度研究「Shallow Research」功能
2025年2月18日,上海秘塔网络科技有限公司宣布推出其最新的研究模式——“浅度研究”(Shallow Research)。这一功能旨在通过AI技术快速收集信息并完成初步分析,帮助用户在短时间内获取有价值的研究成果。
2025-02-04 16:21:22 318人关注
微软正式开源超强小模型Phi-4 性能测试超越GPT-4o、Llama-3.1
微软近期在 Hugging Face 平台上发布了名为 Phi-4的小型语言模型,这款模型的参数量仅为140亿,但在多项性能测试中表现出色,超越了众多知名模型,包括 OpenAI 的 GPT-4o 及其他同类开源模型如 Qwen2.5和 Llama-3.1。
2025-01-24 12:32:31 93人关注
Hugging Face 推出小巧AI模型,助力设备性能提升
近期,人工智能开发平台 Hugging Face 团队发布了两款新型 AI 模型,SmolVLM-256M 和 SmolVLM-500M。他们自信地声称,这两款模型是目前为止体积最小的 AI 模型,能够同时处理图像、短视频和文本数据,尤其适合内存少于1GB 的设备如笔记本电脑。这一创新让开发者在处理大量数据时,能够以更低的成本实现更高的效率。
2025-01-17 04:41:42 121人关注
可在手机运行!Hugging Face推小语言模型SmolLM 低参数表现优秀
最近,Hugging Face推出了一款全新的AI工具——SmolLM。这是一系列高性能的小型语言模型,参数从135M到1.7B不等,专门为各种设备和应用设计。想象一下,这些小模型能够在手机和笔记本电脑上高效运行,简直太酷了!
2025-01-16 19:35:10 100人关注
OpenAI发布新技术PVG:用小模型验证大模型输出的准确性
OpenAI最近发布了一项名为Prover-Verifier Games(PVG)的新技术,旨在解决人工智能模型输出的“黑盒”问题。
2025-01-16 05:26:43 147人关注
苹果开源小模型 DCLM-Baseline-7B 包括所有训练过程和素材
最近,苹果公司开源了DCLM-Baseline-7B模型,这个举动无疑将为AI语言模型的发展带来深远的影响。
2025-01-03 22:12:30 204人关注
Jina AI 发布革命性小模型,轻松将HTML转为优雅 Markdown!
Jina AI 推出了两款专门为将原始 HTML 内容转化为干净整洁的 Markdown 格式而设计的小型语言模型,让我们摆脱琐的网页数据处理。
2024-12-23 14:11:10 68人关注
英伟达AI小模型掌控人形机器人,1.5M参数完胜专业系统
英伟达研究团队近日在机器人控制领域取得重大突破。他们开发的神经网络系统HOVER,以极其精简的参数量实现了对人形机器人的高效控制,其性能甚至超越了专门设计的控制系统。