AI奇点网2024年2月29日报道丨AI资讯早报
2月28日,阿里巴巴的人工智能技术研发团队发布了基于音频驱动的肖像脸部表情神态动作视频生成框架EMO(Emote Portrait Alive)。这种创新性的技术架构,让用户只需输入一张参考的图像和一段声音音频用于解析,该框架能够生成具有丰富面部表情和头部姿势的声音肖像视频。
该技术利用先进的音视频扩散模型,在有限的数据条件下,也能高效模仿原始数据,并快速生成具有高度真实感和丰富表现力的肖像视频。官方展示的视频案例显示,不仅可以让《蒙娜丽莎》本人的肖像开口说话,还可以呈现不同的语言和跨次元的风格,比如让电视剧《狂飙》的男主角“高启强”用法律老师罗翔的声音讲述法律考试在线课程。
项目主页:
https://humanaigc.github.io/emote-portrait-alive/