LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-07-03 16:12:19 76人关注

探秘 LLM 强化学习兼容性:上海交大揭示 Llama 与 Qwen 差异,推出 OctoThinker

大型语言模型(LLM)通过结合任务提示和大规模强化学习(RL)在复杂推理任务中取得了显著进展,如 Deepseek-R1-Zero 等模型直接将强化学习应用于基础模型,展现出强大的推理能力。然而,这种成功在不同的基础模型系列中难以复制,尤其是在 Llama 系列上。这引发了一个核心问题:究竟是什么因素导致了不同基础模型在强化学习过程中表现不一致?

大型语言模型 LLM 强化学习 Deepseek-R1-Zero 模型 基础模型表现差异 Llama 系列强化学习 复杂推理任务

2025-03-04 12:36:12 101人关注

​腾讯AI实验室与上海交大携手破解o1模型 “过度思考” 难题

近年来,随着大语言模型(LLM)的广泛应用,这些模型在复杂推理和问题解决任务中发挥了重要作用。其中,受 OpenAI 的 o1架构启发的 o1-like 模型以其独特的人类思维、逐步推理的能力脱颖而出。然而,这些模型也存在一个显著的低效问题,即 “过度思考”。

腾讯AI Lab 上海交通大学 O1模型 AI大模型 大模型技术

2025-01-12 14:28:15 155人关注

上交大携手字节跳动推出LSLM:AI语音模型实现"边听边说"突破

近日,上交大LANCE实验室和字节跳动联手推出了一款名为LSLM的新型交互式语音模型。据称,这款模型可以边听边说,效果非常好,接近人类自然的对话方式。

上海交大 字节跳动 LSLM AI语音模型 语音模型技术

2025-01-12 07:29:38 75人关注

上海交大博士发现大bug!AI画家竟然画不出茶杯中的冰可乐!

在人工智能领域,AI画家的能力一直在不断突破和进步。然而,即使是最先进的AI图像生成模型,也可能在某些看似简单的任务上遇到难题。最近,上海交通大学博士研究生赵峻图及其团队在研究中发现,AI在生成“茶杯中的冰可乐”这一场景时,表现出了意料之外的困难。

AI绘画失败案例 AI绘画技术缺陷 AI绘画局限性 AI绘画错误分析 AI绘画应用挑战

2025-01-11 15:37:19 109人关注

字节、上海交大联合推全新语音模型LSLM 可边听边说

上海交通大学X-LANCE人工智能实验室与字节跳动联手打造的LSLM(Listen-Speak Language Model)全双工语言模型,让AI助手能够在对话中边说边听,实现真正的实时交互。

字节跳动 上海交通大学 LSLM 语音模型 大模型技术 AI语音技术

2024-12-31 17:13:38 134人关注

上海交大与复旦大学联手打造糖尿病专用大模型Diabetica

上海交通大学清源研究院MIFA实验室与复旦大学附属中山医院内分泌科组建的专家团队,近日联合开发了一款名为Diabetica的糖尿病专用大模型。该模型融合了大模型的语言处理能力与糖尿病专业知识,旨在为医生、患者及医疗教育提供智能支持。

上海复旦大学糖尿病模型 糖尿病预测模型 复旦糖尿病研究 糖尿病AI模型 糖尿病大数据分析

2024-12-31 08:36:32 102人关注

大模型新玩法!腾讯优图与上交大联手 利用公开知识提升大模型

腾讯优图实验室与上海交通大学的研究团队联手推出了一项革命性的知识增强方法,为大模型优化开辟了全新道路。这项创新技术摒弃了传统模型微调的局限,直接从开源数据中提取知识,大幅简化了模型优化流程,在多项任务中实现了超越现有最先进技术(SOTA)的卓越表现。

腾讯大模型 大模型增强技术 腾讯与上海交大合作 大模型联合研发 大模型技术升级

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10