LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-06-04 12:17:30 210人关注

B站文本转语音模型IndexTTS :支持拼音纠正汉字发音、精准控制停顿

B站的一款基于 XTTS 和 Tortoise 的 GPT 风格文本转语音(TTS)模型 IndexTTS 正式发布。该系统在处理中文文本时,具备独特的拼音纠正汉字发音能力,并能够通过标点符号在任意位置精准控制停顿。这一创新的技术使得文本转语音的效果更加自然流畅,受到了广泛关注。

bilibili文本转语音模型 IndexTTS 拼音校正技术 语音合成技术 文本转语音优化

2025-05-29 16:33:11 103人关注

MotionPro炸场!AI视频生成革命来袭,40ms一帧精准控制,影视游戏行业要变天

AI领域迎来一项重大技术突破——MotionPro,一款专为图像到视频(I2V)生成设计的精密运动控制器正式亮相。这一技术通过创新的区域轨迹和运动掩码技术,实现了对物体和镜头运动的精细化控制,为视频生成带来了前所未有的灵活性和精确性。AIbase为您整理了MotionPro的最新进展及其对行业的深远影响。

AI视频生成 MotionPro AI 视频生成革命 AI视频技术 AI视频创新

2025-02-20 18:32:26 218人关注

字节跳动开源全新AI模型LatentSync 精准控制唇形同步

字节跳动近日开源了一项名为 LatentSync 的创新技术,该技术是一种基于音频条件的潜在扩散模型的端到端唇同步框架。这项技术无需任何中间运动表示,即可实现视频中人物唇部动作与音频的精准同步。与以往基于像素空间扩散或两阶段生成的唇同步方法不同,LatentSync 直接利用了 Stable Diffusion 的强大功能,能更有效地建模复杂的视听关联。

字节跳动 LatentSync 唇音同步技术 AI视频生成 音视频同步技术 字节跳动AI技术

2025-01-27 18:12:23 130人关注

Kinetix 推出全新AI视频技术 可精准控制角色动作

在数字创作领域的技术竞争日趋白热化之际,Kinetix推出了一项令人瞩目的AI视频技术,让角色动作控制达到了新的精准度。这项技术通过创新性地结合真人表演视频和文本指令,实现了对数字角色动作的精确操控。

Kinetix AI AI视频技术 精准控制 视频技术应用 AI视频处理 Kinetix AI 创新

2025-01-09 21:37:32 83人关注

瘦身90%还能飞?ControlNeXt让钢铁侠跳美女舞蹈 动作精准到手指

港中文贾佳亚团队最新推出的ControlNeXt简直是AI界的"减肥神器"!这个开源图像/视频生成引导工具不仅体型小巧,与Stable Diffusion家族的常见模型如SDXL、SD1.5等完美适配,而且还是即插即用的,大大简化了使用过程。

控制Next 钢铁侠跳舞 精准控制 机器人舞蹈 AI控制技术 Next机器人应用

2024-12-16 09:18:17 93人关注

新加坡医院利用 AI 技术精准控制抗生素使用

新加坡综合医院(SGH)正在开发一款名为 “增强智能传染病”(AI2D)的人工智能解决方案,旨在判断开处方抗生素的必要性、减少抗生素的使用,并为每位患者识别最合适的抗生素。该项目与 DXC 科技公司合作,目前已覆盖肺炎病例。

新加坡医院AI应用 AI抗生素控制 医疗AI技术 新加坡医疗创新 AI在抗生素管理中的应用

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10