隨著人工智能,、虛擬現(xiàn)實等技術的發(fā)展和融合,數(shù)字人正在以高度擬人化進入生產生活各個領域,將成為數(shù)字經濟發(fā)展的“新動能”,為 Z 時代新消費市場,以及產業(yè)數(shù)字化轉型構筑巨大的想象空間和應用前景,。
作為領先的人工智能軟件公司,商湯科技正憑借領先的原創(chuàng)AI技術,不斷幫助降低AI數(shù)字人的應用門檻,推動數(shù)字人走入千行百業(yè),創(chuàng)造更大的商業(yè)空間,。
近日,全球知名研究機構弗若斯特沙利文(Frost & Sullivan,簡稱沙利文)聯(lián)合頭豹研究院發(fā)布《2022年中國數(shù)字人市場觀測報告-里程碑》,。報告顯示,商湯科技數(shù)字人已全面進入“成熟階段”成為市場領導者,并在十個評估指標中獲得六項最高分,廠商整體競爭力排名第一,。同時,國際數(shù)據公司(IDC)發(fā)布《中國AI數(shù)字人市場現(xiàn)狀與機會分析,2022》報告顯示,商湯科技憑借出色的產品能力,、商業(yè)化案例、用戶體驗和戰(zhàn)略愿景,位列數(shù)字人廠商格局的第一梯隊,。
圖:中國數(shù)字人市場綜合競爭表現(xiàn)(來源:沙利文咨詢,頭豹研究院)
今年4月,商湯科技聯(lián)合增強現(xiàn)實核心技術產業(yè)聯(lián)盟(CARA)共同發(fā)布了《企業(yè)級AI數(shù)字人:數(shù)字經濟發(fā)展“新動能”》白皮書,首次將數(shù)字人的發(fā)展劃分為L1~L5五個等級,并闡述了商湯對AI數(shù)字人技術趨勢的核心洞察,。
AI時代,數(shù)字人正在從有顏無智的“CG數(shù)字模特”,進化為可提高生產力、驅動創(chuàng)新服務的“擬人服務式AI”,融入數(shù)字中國的千行百業(yè),成為“十四五”數(shù)字經濟的新交互媒介,、新商業(yè)智能服務,、新政務便民窗口。通過數(shù)字技術實現(xiàn)對現(xiàn)實世界的改造,AI數(shù)字人將促進數(shù)字經濟與實體經濟的融合和發(fā)展,成為實體產業(yè)生產力的代表,。
L4級數(shù)字人將推動生產力變革
曾經,游戲,、電影中創(chuàng)作的逼真CG人物是科幻遐想的代表。如今,這樣的人物已經可以在現(xiàn)實世界中與我們面對面互動,變身各式各樣的服務助手,。
從完全手工創(chuàng)作到完全智能化交互,在白皮書中,商湯從擬人化和生產自動化兩個維度,將數(shù)字人的進化歷程劃分為五個階段:
L1級:主要以人工制作為主;
L2級:依靠動捕設備采集表情,、肢體等動作,例如電影動畫制作;
L3級:可依靠算法驅動口型、表情和動作,例如虛擬化身實時互動;
L4級:實現(xiàn)部分智能化交互,在垂直領域創(chuàng)新服務模式;
L5級:實現(xiàn)完全智能化交互,打造真正的個性化虛擬助手,。
達到L4級別,意味著數(shù)字人不僅實現(xiàn)了AI仿真動畫生成能力與自然語言理解能力的結合,通過學習大量的真人會話,、語氣、表情和動作,可根據表達內容生成相應神態(tài)和全身動作,輸出栩栩如生的擬人效果,同時,結合AI算法在制作流程中的深度融合(AIGC),制作效率也得到了大幅提升,。只有達到L4或更高級別,AI數(shù)字人才能真正的走入千行百業(yè),推動生產力的變革,。
在深度學習技術的加持下,更高級別的AI數(shù)字人將逐步兼具人類認知能力和機器認知能力,既可以在短時間內學習不同領域的人類知識,成為相關領域的專家,同時又可以在海量數(shù)據中提取更多規(guī)律,超越人類的現(xiàn)有認知,突破生產力的邊界。
實現(xiàn)AI數(shù)字人“量產”,提效千行百業(yè)
白皮書指出,多模態(tài)交互,、深度學習和AIGC是AI數(shù)字人的三大特征,。其中,在應用層面,多模態(tài)交互是 AI 數(shù)字人的“核心力”,可以充分模擬人與人之間自然真實的交互方式;在價值層面,深度學習是 AI 數(shù)字人的“創(chuàng)造力”,能夠結合不同領域的知識庫和海量數(shù)據訓練,進行深度學習和迭代升級,快速適應瞬息萬變的市場變化和細分化的場景需求;在制作層面,AIGC 是 AI 數(shù)字人的“生產力”,可結合 AI 算法快速生成數(shù)字人高精度 3D 模型,將傳統(tǒng)以月計算的制作周期縮短至數(shù)天內完成。
作為AI數(shù)字人技術的領導者,商湯以原創(chuàng)的多模態(tài)交互,、深度學習和全棧式的AIGC(AI Generated Content)技術,構建了智能化生成,、智能化驅動和智能化交互三大引擎,打造出“一站式”AI數(shù)字人生產流水線。在實現(xiàn)媲美真人的逼真程度上,讓AI數(shù)字人“更聰明,、更專業(yè)”,并實現(xiàn)“聽得懂,看得見,說得出”的人機交互效果,。
得益于自動化的流水線,商湯已根據行業(yè)需求,快速、靈活地創(chuàng)建了不同角色的AI數(shù)字人,在文旅,、展館,、金融、教育,、商超等實體產業(yè)中規(guī)?;瘧?為用戶提供多樣化的服務和體驗,。
比如,在上海中共一大紀念館中,商湯AI數(shù)字人擔任講解員,為參會者講解黨史;在廣州永旺商城,商湯AI數(shù)字人則是導購員,為顧客提供智能的問詢服務;在寧波銀行上海分行,擔任大堂經理,提供各類業(yè)務咨詢和問題回復。在2020年世界人工智能大會上,商湯AI數(shù)字人還擔任大會導覽員,向參會嘉賓講解AI在不同領域的落地應用和成果,。
而在醫(yī)院場景,AI數(shù)字人可以為患者進行分診導診,在減輕導診臺壓力的同時為患者帶來有溫度的關懷,。在智能汽車的車艙中,AI數(shù)字人還可化身虛擬行車伴侶,為用戶定制專屬形象,并通過媲美真人的動作和語言與用戶互動,為人車交互融入更多情感元素。
隨著技術發(fā)展邁向更高階的智能等級,AI數(shù)字人也將不僅限于我們所看到的人物形象,它成為可以通過不斷機器學習,成為突破想象力的AI智能體,。
例如在游戲中,AI驅動的NPC可以與人類玩家協(xié)同作戰(zhàn);在社群中,AI可以成為擔任社群管理員,提升運營效率和管理水平,。
在不遠的未來,無論是在現(xiàn)實世界還是影視、游戲作品中,AI數(shù)字人,、AI智能體都將無處不在,為我們增添娛樂體驗,、帶來便捷服務、實現(xiàn)效率提升,深刻改變我們的生活和工作方式,。白皮書指出,隨著人工智能,、虛擬現(xiàn)實等相關技術的逐步成熟,通過深度學習和認知泛化,AI數(shù)字人將會全面突破應用邊界,升級成為數(shù)字世界的“超級助手”。
如需獲取《企業(yè)級AI數(shù)字人:數(shù)字經濟發(fā)展“新動能”》白皮書,敬請關注商湯智能產業(yè)研究院公眾號并回復“數(shù)字人白皮書”獲取,或點擊以下鏈接直接下載:
https://oss.sensetime.com/files/AI%20digital%20man%20whitepaper.pdf