A日报：B站升级动漫视频生成模型AniSora V3；字节开源4D视频生成框架EX-4D；DeepSWE开源AI Agent系统强势登顶

作者：AIbase基地更新时间：2025-07-04 08:23:28 共572人关注

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、字节跳动EX-4D震撼开源:单目视频秒变自由视角4D大片

EX-4D是字节跳动PICO-MR团队推出的4D视频生成框架，能够从单目视频生成高质量、多视角的4D视频序列。该技术通过深度密闭网格（DW-Mesh）和轻量级适配架构，解决了传统视频生成技术在多视角生成中的挑战，并在性能指标上全面领先。

【AiBase提要:】

💡 EX-4D利用深度密闭网格（DW-Mesh）实现单目视频到多视角的高质量生成。

🔍 通过渲染mask和跟踪mask策略，解决多视角数据稀缺问题。

🚀 在FID、FVD和VBench等指标上全面超越现有开源方法，性能表现卓越。

详情链接:https://github.com/tau-yihouxiang/EX-4D

2、Bilibili开源动漫视频生成模型AniSora V3版，一键生成多种风格动漫视频镜头

Bilibili宣布其开源动漫视频生成模型AniSora V3迎来重大更新，显著提升了生成质量、动作流畅度和风格多样性。该版本基于CogVideoX-5B和Wan2.1-14B模型，结合强化学习与人类反馈（RLHF）框架，支持多种动漫风格的视频生成，为创作者提供了更强大的工具。

【AiBase提要:】

✨ AniSora V3通过时空掩码模块优化，增强了动画任务的控制能力。

🚀 支持多任务处理，包括单帧图像生成视频、关键帧插值和唇部同步等功能。

📦 开源生态推动社区协作，开发者可通过GitHub获取代码和数据集。

详情链接:https://t.co/I3HPKPvsBV

3、DeepSWE 开源 AI Agent系统强势登顶，基于 Qwen3-32B

DeepSWE 是一款基于 Qwen3-32B 模型的开源 AI Agent 系统，通过强化学习进行训练，并在 SWE-Bench-Verified 测试中取得了出色的性能表现。该系统采用 rLLM 框架和改进的 GRPO++ 算法，在软件工程任务中展现出强大的学习能力与应用潜力。

【AiBase提要:】

🧠 DeepSWE 是基于 Qwen3-32B 模型，完全通过强化学习训练而成，开源信息已全面发布。

🏆 在 SWE-Bench-Verified 测试中，DeepSWE 表现出色，Pass@1准确率达到了59%，成为所有开源代理中的佼佼者。

💡 采用了 rLLM 框架和改进的 GRPO++ 算法，DeepSWE 在实际软件工程任务中展现了其强大的学习能力和应用潜力。

详情链接:https://huggingface.co/agentica-org/DeepSWE-Preview

4、字节跳动开源新模型VINCIE-3B:3亿参数，支持上下文连续图像编辑

字节跳动开源了支持上下文连续图像编辑的VINCIE-3B模型，该模型基于MM-DiT架构开发，能够从视频中学习并实现高效的图像编辑。其技术亮点包括视频驱动训练、块因果扩散变换器以及三重代理任务训练，显著提升了图像编辑的质量和效率。

【AiBase提要:】

🎥 视频驱动训练:VINCIE-3B利用视频的连续帧，自动提取文本描述与图像序列，构建多模态训练数据。

🧠 块因果扩散变换器:模型采用块因果注意力机制，在文本和图像块之间实现因果注意力，块内则为双向注意力。

🔄 三重代理任务训练:通过下一帧预测、当前帧分割预测和下一帧分割预测三种任务进行训练，增强模型对动态场景和物体关系的理解能力。

详情链接:https://huggingface.co/ByteDance-Seed/VINCIE-3B

5、Stability AI开源Stable Audio Open Small，手机秒变音频创作神器

Stability AI与Arm合作推出Stable Audio Open Small，一款专为移动设备优化的轻量级文本到音频生成模型。该模型在移动端本地运行，支持离线处理，具备高效、低延迟和高质量输出的特点，推动了AI音频生成技术向边缘计算和移动设备的转型。

【AiBase提要:】

📱 轻量化设计:参数量压缩至341M，适合移动端运行。

🔊 高质量音频生成:支持立体声音频生成，无需云端处理。

🌐 开源赋能开发者:遵循社区许可，降低技术门槛，鼓励创意应用。

详情链接:https://huggingface.co/stabilityai/stable-audio-open-small

6、谷歌重磅发布Gemini for Education!免费AI工具席卷全球教育

谷歌推出全新AI工具套件Gemini for Education，基于最新一代Gemini2.5Pro模型和LearnLM学习型大模型，为全球师生提供免费、强大且高效的学习与教学支持。该工具覆盖30多种功能，支持40多种语言，旨在通过AI技术赋能教育工作者和学生，打造更加个性化和高效的学习体验。

【AiBase提要:】

🌍 全球化教育赋能:支持40多种语言，覆盖230多个国家和地区。

📚 免费开放:对所有Google Workspace for Education用户完全免费，推动教育公平。

🔒 安全与隐私:严格遵循隐私条款，确保用户数据安全。

7、Topview Avatar2震撼发布!AI数字人革新电商带货，模特时代终结?

Topview Avatar2通过突破性的功能和逼真的效果，为出海电商和内容创作者带来了革命性的体验。其创新的AI数字人技术能够实现产品与数字人的自然交互，极大提升了视频制作效率和内容质量。

【AiBase提要:】

🌍 全球首创AI数字人“穿戴”产品，实现更真实的交互效果。

⚙️ 一键生成定制化视频，支持多语言口型同步，提升营销灵活性。

🚀 革新传统UGC视频模式，降低电商拍摄门槛，助力品牌全球化。

详情链接:https://www.topview.ai/ai-product-avatar

8、Perplexity推出Max订阅计划:每月200美元解锁无限AI生产力

Perplexity推出了高端订阅计划Max，定价为每月200美元或每年2000美元，旨在满足高频用户和专业人士的需求。该计划提供无限量访问Labs、优先体验新功能以及最新前沿模型的支持，标志着其在AI生产力工具领域的进一步深耕。

【AiBase提要:】

🧠 无限Labs查询:满足专业用户对深度研究和复杂项目的需求。

🚀 优先访问前沿模型:确保用户始终站在技术前沿。

🔒 优先支持:提供专用基础设施和更快的客户响应时间。

9、Cursor 大胆挖人!Claude Code 核心人物转投竞争对手

Cursor 挖走 Anthropic 的两位核心人物，标志着 AI 编程市场竞争的加剧。尽管 Anthropic 面临人才流失，但其业务依然强劲，收入和估值显著增长。Anysphere 则借助这些人才进一步提升产品竞争力。

【AiBase提要:】

🧠 Cursor 成功挖走 Anthropic 核心人物，技术实力增强

💼 Boris Cherny 和 Cat Wu 加入 Anysphere，推动产品创新

📈 Anthropic 业务增长迅速，收入和估值均大幅提升

10、OpenAI 声明:Robinh ood 推出的 “OpenAI 代币” 与我们无关

文章指出，Robinh ood 在欧洲推出了 OpenAI 和 SpaceX 的代币化股票，但 OpenAI 明确表示这些代币并非其股权，且与 Robinh ood 没有合作关系。尽管 Robinh ood 提供了限时优惠吸引用户，但美国用户无法参与。这一事件引发了市场的热烈反响，Robinh ood 股价一度飙升。

【AiBase提要:】

💰 OpenAI 强调“OpenAI 代币”不是其股权，与 Robinh ood 无合作。

⚠️ Robinh ood 通过代币化股票吸引投资者，但美国用户无法参与。

📈 Robinh ood 股价因该消息上涨，创下历史新高。

A日报：B站升级动漫视频生成模型AniSora V3；字节开源4D视频生成框架EX-4D；DeepSWE开源AI Agent系统强势登顶

推荐阅读

上云服务