微软创新AI技术:静态图像秒变逼真动画

发表时间: 2024-04-21 19:00

#身边奇闻趣事#

快速导读:微软的研究人员开发了一种名为VASA-1的新型人工智能模型,它可以通过将人脸的静态图像与音频剪辑结合,创造出人们说话的逼真视频。这些视频可以由照片般逼真的人脸、卡通或艺术品制作,具有令人信服的嘴唇同步和自然的面部和头部动作。尽管这项技术在教育和提高可访问性方面具有潜在应用,但人们对其潜在滥用和对创意产业的影响表示担忧。

围绕AI生成的视频存在的冒充和误导风险

微软的新AI技术VASA-1引发了人们对冒充和误导的担忧。随着越来越多的工具出现,可以创建令人信服的AI生成图像、视频和音频,专家们担心这种技术的滥用。创造逼真视频的能力可能导致新的误导形式,并破坏电影和广告等创意产业。微软与OpenAI等公司一样,对向公众发布这些工具持谨慎态度,并强调需要负责任地使用并遵守相关法规。

训练逼真面部动画的AI模型

VASA-1 AI模型通过训练大量人们说话的视频,识别自然的面部和头部动作,包括嘴唇运动、表情、眼神和眨眼。这种训练使得模型在为静态照片添加动画时能够产生更逼真的视频。尽管VASA-1生成的视频仍然显示出机器生成的迹象,但微软认为它的模型优于其他类似工具,并为模拟人类对话行为的逼真化头像的实时交互铺平了道路。