一張照片、一段語音生成逼真說話臉孔 - 微軟VASA-1 - 封面
只要一人像照片+ 一段文字,就能產生逼近像真實人說話的畫面,微軟昨天剛發布的VASA-1,聲稱可以提供音頻+照片,就能按照音頻說話讓照片動起來,像是真人說話一樣,甚至可以連音頻也不用,僅提供文字用TTS轉換成語音+圖片也可以。這簡直是對i人型的內容創作者的福音。期待有大神實作出開源的Code。 官方...

閱讀全文 →