专题副刊

一张照片还原声音与场景 引爆私隐与侵权争议

字节跳动于2月10日推出AI影片生成模型Seedance 2.0,主打可利用单张照片生成动态影片,并可自动推断人物声音与背景场景。然而,这项功能迅速引发外界对未经授权使用训练数据,以及严重侵犯私隐的质疑。

Seedance 2.0采用统一多模态音影片联合生成架构,只要输入支援文字、图片、音讯、影片4种模态,用户可同时输入最多9张图片、3段影片、3段音讯及文字指令。相比1.5版本,新版本在复杂交互及运动场景下的生成质素大幅提升,物理准确度、逼真度及可控性显着增强,更贴合工业级创作场景需求。

Advertisement

该模型能生成15秒高质素多镜头音影片,支援2K解像度输出,生成速度较前代快30%。而今,网络平台已产生大量病毒式传播影片,包括汤告鲁斯与毕彼特在天台对决等视频和照片,已在网络获得数百万人次的观看率。

標籤
你也可能感兴趣...
Close