字节跳动AI视频新模型杀入CapCut

2026-03-26 23:40:17

字节跳动动作真快。

就在OpenAI悄然关停Sora应用没几天,字节跳动周四确认,其Dreamina Seedance 2.0音频视频联合生成模型已在CapCut里开启分阶段推送。创作者现在能用文字提示、图片或参考视频,直接起草、编辑和同步视频音频内容。首发市场锁定巴西、印尼、马来西亚、墨西哥、菲律宾、泰国和越南,后续会陆续加码。

这步棋下得有点意思。之前有报道说模型全球铺开一度暂停,就是为了处理知识产权争议,好莱坞那边指责版权侵权问题闹得挺凶。眼下先在这些新兴市场试水,也算避开锋芒。中国用户早就在剪映App里用上了。

Seedance 2.0牛在哪儿?字节跳动自己说,哪怕只扔几个词描述场景,它也能生成视频,不靠参考图也行。真实纹理、动作流畅度、灯光效果,在各种视角和角度下都处理得不错。创作者拿它修自家素材、补镜头,或者拿草图先跑个idea测水温,都挺实用。

更狠的是,它还能搞定以前AI视频模型容易翻车的领域。做菜教程、健身教学、产品介绍、带动作的场景,这些内容现在能直接生成。首发支持最长15秒的片段,覆盖6种宽高比。音频视频同步生成,唇同步、空间音效这些细节也跟上了。

CapCut里,模型会出现在AI Video编辑功能和Video Studio生成工具里。还同步推到字节的Dreamina平台和营销工具Pippit。安全限制拉满:不允许用含真实人脸的图片或视频生成内容,也堵死未经授权的IP生成。产出的视频会带隐形水印,方便平台外传播时追踪溯源。

现实点看,这限制要是铁板一块,美国市场早该开放了。显然后台还在调参数。字节跳动也表态,会边 rollout 边找专家和创作者社区合作,迭代模型能力。

市场这边,加密货币今天整体承压。BTC现报$68,882(24h -2.74%),ETH现报$2,063(24h -4.47%),资金面偏谨慎,但AI工具的落地节奏没停。字节跳动这套打法,明显瞄准了全球创作者的日常生产力痛点。简单文本就能出片, multimodal 输入让控制力更强,动作稳定性直接拉到导演级。

以前AI视频总被吐槽“看起来像AI”,Seedance 2.0在物理真实感和多镜头连贯性上下了功夫。烹饪视频里蒸汽升腾的质感,健身动作的肌肉拉伸,产品展示里的光影变化,这些细节处理得更接地气。创作者不用先拍一堆素材再剪,能先在CapCut里用AI跑通整个流程,省时省力。

当然,争议不会消失。版权水印加了,脸部生成禁了,但好莱坞和权利方还在盯着。字节跳动选择先在东南亚和拉美这些增长快的市场铺开,观察反馈再扩,也算务实一步。CapCut本身用户基数大,年轻创作者多,这波集成等于直接把AI视频生成塞进日常编辑链路里。

技术细节上,Seedance 2.0用了统一的音频视频多模态架构,支持文本、图像、音频、视频多种输入。相机运动、灯光阴影、表演控制这些都能精细调节。输出对齐行业电影标准,效率提升肉眼可见。

对普通用户来说,这意味着什么?手机里打开CapCut,输入“一个女孩在海边慢跑,晨光洒在浪花上,背景轻音乐”,就能得到一段带音效的15秒片子。想改角度、加特效、同步旁白,都在同一时间线里搞定。不用切来切去,不用等渲染半天。

字节跳动还在继续加码。模型会随版本迭代,安全机制也会同步优化。创作者社区的反馈,将直接影响下一步功能走向。AI视频赛道,OpenAI那边暂时收手,字节跳动却在加速把工具推到一线用户手里。

这场较量,才刚进入新阶段。

« 伊朗石油冲击引爆对冲基金大出血 加密市场却顽强挺住... Coinbase联手Better推加密抵押首付 Fannie... »

相关资讯