微软最新AI算法通过照片和音频产生逼真头像演讲视频

越来越多的研究表明,只要语料库足够大,几乎任何人的面部动作都可以与语音片段同步。今年6月,三星的应用科学家详细介绍了一种端到端的模型,该模型可以在一个人的头像中动画化眉毛、嘴巴、睫毛和脸颊。几周后,Udacity展示了一个系统,该系统可以从音频叙述中自动生成一个站立的语音视频。两年前,卡内基梅隆大学(carnegie mellon university)的研究人员发表了一篇论文,描述了一种将面部动
相关文章
相关标签/搜索