字节跳动AI视频新模型杀入CapCut

2026-03-26 23:40:17

字节跳动动作真快。

就在OpenAI悄然关停Sora应用没几天，字节跳动周四确认，其Dreamina Seedance 2.0音频视频联合生成模型已在CapCut里开启分阶段推送。创作者现在能用文字提示、图片或参考视频，直接起草、编辑和同步视频音频内容。首发市场锁定巴西、印尼、马来西亚、墨西哥、菲律宾、泰国和越南，后续会陆续加码。

这步棋下得有点意思。之前有报道说模型全球铺开一度暂停，就是为了处理知识产权争议，好莱坞那边指责版权侵权问题闹得挺凶。眼下先在这些新兴市场试水，也算避开锋芒。中国用户早就在剪映App里用上了。

Seedance 2.0牛在哪儿？字节跳动自己说，哪怕只扔几个词描述场景，它也能生成视频，不靠参考图也行。真实纹理、动作流畅度、灯光效果，在各种视角和角度下都处理得不错。创作者拿它修自家素材、补镜头，或者拿草图先跑个idea测水温，都挺实用。

更狠的是，它还能搞定以前AI视频模型容易翻车的领域。做菜教程、健身教学、产品介绍、带动作的场景，这些内容现在能直接生成。首发支持最长15秒的片段，覆盖6种宽高比。音频视频同步生成，唇同步、空间音效这些细节也跟上了。

CapCut里，模型会出现在AI Video编辑功能和Video Studio生成工具里。还同步推到字节的Dreamina平台和营销工具Pippit。安全限制拉满：不允许用含真实人脸的图片或视频生成内容，也堵死未经授权的IP生成。产出的视频会带隐形水印，方便平台外传播时追踪溯源。

现实点看，这限制要是铁板一块，美国市场早该开放了。显然后台还在调参数。字节跳动也表态，会边 rollout 边找专家和创作者社区合作，迭代模型能力。

市场这边，加密货币今天整体承压。BTC现报$68,882（24h -2.74%），ETH现报$2,063（24h -4.47%），资金面偏谨慎，但AI工具的落地节奏没停。字节跳动这套打法，明显瞄准了全球创作者的日常生产力痛点。简单文本就能出片， multimodal 输入让控制力更强，动作稳定性直接拉到导演级。

以前AI视频总被吐槽“看起来像AI”，Seedance 2.0在物理真实感和多镜头连贯性上下了功夫。烹饪视频里蒸汽升腾的质感，健身动作的肌肉拉伸，产品展示里的光影变化，这些细节处理得更接地气。创作者不用先拍一堆素材再剪，能先在CapCut里用AI跑通整个流程，省时省力。

当然，争议不会消失。版权水印加了，脸部生成禁了，但好莱坞和权利方还在盯着。字节跳动选择先在东南亚和拉美这些增长快的市场铺开，观察反馈再扩，也算务实一步。CapCut本身用户基数大，年轻创作者多，这波集成等于直接把AI视频生成塞进日常编辑链路里。

技术细节上，Seedance 2.0用了统一的音频视频多模态架构，支持文本、图像、音频、视频多种输入。相机运动、灯光阴影、表演控制这些都能精细调节。输出对齐行业电影标准，效率提升肉眼可见。

对普通用户来说，这意味着什么？手机里打开CapCut，输入“一个女孩在海边慢跑，晨光洒在浪花上，背景轻音乐”，就能得到一段带音效的15秒片子。想改角度、加特效、同步旁白，都在同一时间线里搞定。不用切来切去，不用等渲染半天。

字节跳动还在继续加码。模型会随版本迭代，安全机制也会同步优化。创作者社区的反馈，将直接影响下一步功能走向。AI视频赛道，OpenAI那边暂时收手，字节跳动却在加速把工具推到一线用户手里。

这场较量，才刚进入新阶段。

« 伊朗石油冲击引爆对冲基金大出血加密市场却顽强挺住... Coinbase联手Better推加密抵押首付 Fannie... »

字节跳动AI视频新模型杀入CapCut

相关资讯