2025-02-20 18:32:26
                        426人关注
                    
                    字节跳动开源全新AI模型LatentSync 精准控制唇形同步
                    字节跳动近日开源了一项名为 LatentSync 的创新技术,该技术是一种基于音频条件的潜在扩散模型的端到端唇同步框架。这项技术无需任何中间运动表示,即可实现视频中人物唇部动作与音频的精准同步。与以往基于像素空间扩散或两阶段生成的唇同步方法不同,LatentSync 直接利用了 Stable Diffusion 的强大功能,能更有效地建模复杂的视听关联。
                    
                        
                        字节跳动
                        
                        LatentSync
                        
                        唇音同步技术
                        
                        AI视频生成
                        
                        音视频同步技术
                        
                        字节跳动AI技术