人形機器人可完成多語言逼真唇形動作，在教育和老年護理領域具應用潛力

2026-01-20 01:45:00 來源: 科技日報點擊數：

科技日報北京記者張夢然

美國哥倫比亞大學科學家設計出一種新型框架，使人形機器人面部能夠根據音頻生成逼真的唇部動作，實現與人類語音的同步。該技術還展示了較強的泛化能力，可推廣至包括法語、漢語和阿拉伯語在內的多種語言，即使這些語言并未出現在訓練數據中。研究團隊在發表于最新一期《科學·機器人學》上的論文中指出，這一進展是朝著構建不僅能執行功能，還能進行人性化交流的機器人邁出的重要一步。

在對話中，如果機器人的唇部動作與聲音不匹配，會顯得呆板且不自然。然而，現有機器人普遍缺乏執行精細口部動作的靈活性，能實時將語音轉化為自然唇部運動指令的技術也寥寥無幾。

研究團隊在2024年曾發表研究，描述了一種人形機器人面部可以預測人類的微笑并同時再現該表情。在此基礎上，為更加精細化唇部與聲音的匹配，團隊設計了一套學習流程：首先采集機器人唇部運動的視覺數據，用于訓練模型并生成運動參考點；隨后通過一個名為“面部動作轉換器”的模塊產生運動指令，使機器人的唇部能夠流暢配合不同詞語。他們還專門研制了一種人形機器人面部結構，采用柔軟硅膠皮膚，配合磁性連接器，具備10個自由度，可驅動復雜的唇部運動。其唇部結構能形成覆蓋24個輔音和16個元音的各種口型。

在驗證過程中，團隊借助ChatGPT生成測試語句，并合成了具有理想唇部動作的視頻作為對比基準。結果表明，該方法在5種比較方案中表現最優，其生成的唇部動作與理想視頻差異最小。此外，該框架還能為11種不同語音結構的非英語語言生成自然的唇部同步效果。

研究團隊推測，這類人形機器人在教育、老年護理等領域具有應用潛力。但他們也強調，未來的設計工作需格外謹慎，以防止技術被濫用。

總編輯圈點

現在，AI讓虛擬人物動嘴說話已經“不在話下”，然而讓機器人做到這點還相當困難。大多數機器人“說話”時并不動嘴，即使動嘴，也只是象征性一張一合。這次，科研人員試圖讓機器人擁有人類一般細膩、精準的唇部動作，教它們通過合成視頻以“照鏡子”的方式學習；還開發了硅膠皮膚，設計了面部機械系統。結果表明，機器人可以“學會”多種語言的唇部動作。不過，研究也不禁讓人思考，當機器人真的開口說話，“恐怖谷效應”是會加重還是減輕？

責任編輯：常麗君

老牛影视免费观看电视剧-老牛影视文化传媒有限公司官方-老牛影院在线观看电视剧免费-老牛影视在线观看免费观看电视剧

人形機器人可完成多語言逼真唇形動作，在教育和老年護理領域具應用潛力

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標升級或更換您的瀏覽器

3.暫不升級，繼續瀏覽