英偉達開源Audio2Face:AI即時生成臉部動畫多語口型精準同步
根據媒體報道,英偉達宣布將其生成式AI面部動畫模型Audio2Face正式開源,此次開放內容涵蓋基礎模型、完整軟體開發工具包及訓練框架,旨在推動遊戲與3D應用領域快速集成智能虛擬角色。
Audio2Face能夠基於輸入音頻,自動解析其中的音素、語調等聲學特徵,即時驅動虛擬角色產生精準的口型動作與自然的情感表情。
此技術可廣泛應用於遊戲開發、影視製作、虛擬客服等多個場景,並支援預先錄製音訊的離線渲染與動態角色的即時串流處理兩種運行模式。
目前,該技術已在遊戲產業中獲得實際應用。例如,遊戲開發商Survios在《異形:無序入侵 進化版》中整合Audio2Face,顯著簡化了口型同步與臉部動畫的製作流程。
Farm 51工作室也在《車諾比人 2:禁區》中藉助該技術,直接透過音訊產生細膩的臉部表情,不僅大幅節省製作時間,也提升了角色的真實感與玩家的沉浸體驗。該工作室創新總監Wojciech Pazdur稱其為「革命性突破」。
延伸影片閱讀: