根據 iMedia Research 艾媒咨詢發布的數據顯示,近年來,我國數字人市場規模呈現加速增長趨勢。2022 年數字人市場規模已達120.8 億元,帶動周邊市場規模為 1866.1 億元。未來,隨著AI技術的迭代更新,預計到 2025年,我國數字人的主要市場規模將達到 480.6 億元,帶動周邊市場規模近 6402.7 億元。面對數字人產業的強大勢能和潛力,地方政策積極跟進,推進未來產業的發展。其中,北京市前瞻布局數字人產業,并取得了突出成績。截至2023年12月,北京從事數字人相關業務的企業達到2805家,以數字人為主要業務的企業有217家。2023年數字人主要業務企業營收規模約51億元,預計2025年營收規模將突破200億元,帶動周邊經濟效益750億元。智能數字人的語音識別和自然語言處理能力為用戶的交流提供了更加便捷和順暢的體驗。虛擬偶像數字人設計
虛擬數字人(Digital Human / Meta Human),是運用數字技術創造出來的、與人類形象接近的數字化人物形象。1964年,波音公司研發了頭一個具有人的形象的數字人。由于數字人社會實踐功能的呈現,21世紀,數字人成為可以和自然人相伴的“人”。2007年,世界上頭一個使用全息投影技術舉辦演唱會的虛擬偶像初音未來出道。2012年,中國本土偶像洛天依誕生。 功能特征:形象能力:擁有人的外觀,具有特定的相貌、性別和性格等人物特征。 表達能力:擁有人的行為,具有用語言、面部表情和肢體動作表達的能力。感知、互動能力:擁有人的思想,具有識別外界環境、并能與人交流互動的能力。天津身份型數字人解決方案社交平臺數字人通過智能算法和用戶數據分析,為用戶提供個性化推薦和社交互動。
為了生成逼真的動作和聲音,AI數字人需要考慮多個因素,例如姿態、速度、節奏、音調等。目前,動作捕捉和語音合成等技術雖然可以生成流暢的動作和聲音,但仍然存在一些缺陷,例如動作單一、聲音單調、表情缺乏等。為了解決這些問題,研究者提出了許多基于深度學習的動作和聲音生成方法,可以實現更自然、更富有表現力、更適應不同場景和風格的動作和聲音生成。例如基于循環神經網絡或變分自編碼器的動作生成,基于WaveNet或Tacotron等序列到序列模型的語音合成。
而對于早些進入人們眼簾的AI數字人,今年相對熱度沒那么高。從2021年元宇宙帶火數字人,將數字人推向創新的風口后,這幾年數字人的應用并沒有得到普遍的普及。一方面是由于數字人需要基于頂端的適配設備,二是數字人的實際制作成本偏高。目前應用較多的當屬短視頻數字人,被應用于直播帶貨和短視頻IP分身。就目前整個數字人而言,數字人的形象也是參差不齊。有的形象太假,有的場景單一,整體運營成本普遍偏高,目前主要應用在一些頭部企業。在健康和健身領域,數字人可以提供實時的指導和監督。
應用前景,虛擬數字人的應用場景包括娛樂、偶像(如虛擬偶像初音未來、洛天依的舞臺表演 )、代言人(如希加加代言麥當勞)、企業數字化轉型、體育(如度曉曉解說足球 )、金融(如浦發銀行數字員工小浦)等垂直領域。未來,虛擬數字人將在頭一產業農業和第二產業工業領域中(如生產領域、銷售領域、售后服務領域等)更多地被使用。數字人也被稱為虛擬人物(Virtual Character),這是一種由計算機程序驅動的擁有自身意識和身份的人工人。數字人可以在數字世界中展現出與真實人類相同的生理、心理、社會表現。游戲角色數字人是游戲中的虛擬角色,可以與玩家進行互動和戰斗。天津身份型數字人解決方案
虛擬教師數字人結合人工智能和教育內容,為學生提供個性化的學習指導和輔助教育。虛擬偶像數字人設計
虛擬數字人系統一般情況下由人物形象、語音生成、動畫生成、音視頻合成顯示、交互等5個模塊構成。非交互型數字人,系統依據目標文本生成對應的人物語音及動畫,并合成音視頻呈現給用戶。交互型數字人,智能驅動型數字人:通過智能系統自動讀取并解析識別外界輸入信息,根據解析結果決策數字人后續的輸出文本,驅動人物模型生成相應的語音與動作來使數字人跟用戶互動。真人驅動型數字人:真人根據視頻監控系統傳來的用戶視頻,與用戶實時語音,同時通過動作捕捉采集系統將真人的表情、動作呈現在虛擬數字人形象上,從而與用戶進行交互。虛擬偶像數字人設計