- 上云资讯 -
2025-05-16 10:15:33 27人关注
DeepSeek 开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s
DeepSeek 开源周首日正式开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper架构GPU打造的高效多层注意力(Multi-Layer Attention)解码内核。该技术特别针对变长序列场景进行优化,可显著提升大模型推理性能。
2025-04-18 16:27:41 86人关注
腾讯混元InstantCharacter开源,高度角色一致性、自定义姿势、样式和场景
腾讯混元团队宣布其最新研发的InstantCharacter框架现已正式开源。这一基于扩散变换器(DiT)的角色个性化框架,以其高一致性、灵活性和开源特性引发业界广泛关注,为开发者与创作者提供了从单张图像到多样化角色定制的强大工具。AIbase为您解析InstantCharacter的核心亮点及其对AI内容创作的深远影响。
2025-02-16 16:36:46 103人关注
百度宣布文心大模型 4.5 系列即将上线,6月30日全面开源!
近日,百度在其官方渠道上宣布了令人瞩目的消息:文心大模型4.5系列将于未来几个月陆续推出,并定于6月30日正式开源。作为百度在人工智能领域的重要布局,文心大模型的不断升级和开源,意味着更多用户将能够体验到前沿的 AI 技术。
2025-01-21 10:37:28 247人关注
国产大模型再突破!DeepSeek R1开源,性能直逼OpenAI,开启AI平权新时代
DeepSeek近日正式发布并开源了其最新研发的大型语言模型R1,该模型在性能上表现出色,被认为可与OpenAI的o1正式版相媲美。这一举措不仅标志着国产AI技术的又一次重大突破,也为全球AI开发者带来了新的选择。
2025-01-14 10:33:12 47人关注
黄仁勋、扎克伯格力推AI大模型开源 两人互换外套
在第51届SIGGRAPH图形大会上,英伟达CEO黄仁勋和Meta CEO马克·扎克伯格的炉边谈话不仅聚焦于人工智能和仿真模拟的未来,更以一场别出心裁的"外套交换仪式"成为了会议的亮点。
2024-12-22 07:36:21 32人关注
上海AI Lab复刻OpenAI奥数神器,LLaMA版o1开源
近期,开源社区传来好消息:上海AI Lab团队发布了LLaMA版o1项目,旨在复刻OpenAI的奥数解题神器o1。该项目采用了多种先进技术,包括蒙特卡洛树搜索、Self-Play强化学习、PPO以及AlphaGo Zero的双重策略范式,引起了开发者社区的广泛关注。
2024-12-14 10:39:12 35人关注
智谱AI开源端侧大语言和多模态模型GLM-Edge系列
智谱科技近日宣布开源其端侧大语言和多模态模型GLM-Edge系列,这一举措标志着公司在端侧真实落地使用场景中的一次重要尝试。GLM-Edge系列由四种不同尺寸的模型组成,包括GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B和GLM-Edge-V-5B,分别针对手机、车机等移动平台以及PC等桌面平台进行了优化。