AI视频生成,或许就是2024年下一个最前沿(juan)的领域。
回看过去几个月,RunWay的Gen-2、Pika Lab的Pika 1.0.国内大厂等**视频生成模型纷纷涌现,不断迭代升级。
这不,RunWay一大早就宣布Gen-2支持文本转语音的功能了,可以为视频创建画外音。
当然,谷歌在视频生成上也不甘落后,先是与斯坦福李飞飞团队共同发布了W.A.L.T,用Transformer生成的逼真视频引来**关注。
今天,谷歌团队又发布了一个全新的视频生成模型VideoPoet,而且无需特定数据便可生成视频。
VideoPoet
VideoPoet是由Google开发的一款语言大模型,旨在解决视频生成领域的挑战。目前支持多种视频生成任务,包括文本到视频、图像到视频、视频风格化、修复和修复以及视频到音频。