- 上云资讯 -
2025-02-20 14:16:43 209人关注
字节开源嘴型同步模型LatentSync,实现超真实口型同步
近日,字节跳动发布了名为 LatentSync 的新型口型同步框架,旨在利用音频条件潜在扩散模型实现更精确的口型同步。该框架基于Stable Diffusion,针对时间一致性做了优化。
2025-02-11 18:20:29 95人关注
Tim Brooks 跳槽 DeepMind,欲打造新一代世界模型团队
在 AI 领域,人才流动向来是激烈的竞争场所。最近,Tim Brooks 的跳槽事件引发了广泛关注。他在 Sora 工作仅三个月后,宣布转投竞争对手 Google DeepMind。此举被认为是由于 Sora 技术面临严重挑战,特别是在生成速度和性能上,与行业中的其他对手相比表现不佳。
2025-01-27 01:15:29 200人关注
震撼登场!英伟达开源图像生成模型Sana ,1秒生图、支持中英文和emoji
近日,英伟达开源了一款名为 Sana 的图像生成模型,这一模型仅有0.6亿个参数,极大降低了运行门槛。
2025-01-16 07:23:31 239人关注
深度解析AlphaFold 3:斯坦福博士带你从ML工程师视角看超详细图解!
AlphaFold3,简称AF3,是DeepMind团队在蛋白质结构预测领域的最新力作。它不仅能够预测单个蛋白质序列的结构,还能预测蛋白质复合体、核酸或小分子的结构。这就好比,你给AF3一个蛋白质的“食谱”,它就能“烘焙”出这个蛋白质的三维结构。
AlphaFold 3 机器学习工程师视角 蛋白质结构预测 AI生物技术 深度学习模型应用 AlphaFold 3技术解析