6月17日,在百度AI Day開放日上,百度官宣打造業(yè)界首個超頭主播羅永浩數(shù)字人,并發(fā)布了高說服力數(shù)字人的四大技術突破。此前,羅永浩數(shù)字人直播首秀創(chuàng)下超1300萬人次觀看、GMV突破5500萬元的行業(yè)新紀錄,部分核心品類帶貨量反超真人直播。
新一代高說服力數(shù)字人 引領智能電商新篇章
百度副總裁、電商總經理平曉黎表示,今年 4 月百度發(fā)布的高說服力數(shù)字人已讓數(shù)字人帶入 3.0 時代,這是一個新的里程碑,標志著智能電商邁入新篇章,新一代高說服力數(shù)字人成為了一個像真人一樣,形神音容高度協(xié)調、會思考決策、能協(xié)作完成特定任務的超級智能體?!鞍俣鹊牧_永浩數(shù)字人已達到媲美超頭主播的體感效果,隨著大模型與多模能力發(fā)展,數(shù)字人未來超越真人效果極具潛力 ”,她補充道。
在高說服力數(shù)字人的基礎之上,百度電商慧播星再一次迭代,圍繞慧播星首席體驗官羅永浩,發(fā)布了業(yè)界首個超頭主播的數(shù)字人,并實現(xiàn)了體驗、內容、視覺、效果的四大突破,使得數(shù)字人帶貨能力媲美真人。首先是體驗突破,通過復刻羅永浩跟朱蕭木的絲滑配合,上線了業(yè)界首個雙數(shù)字人互動直播間,給營銷轉化和C端體驗,打開了新的想象空間;二是內容新突破,得益于文心4.5T的升級,通過深度訓練,使數(shù)字人做到了“懂創(chuàng)作”,帶貨時塑品專業(yè)度更高,數(shù)字人可以“有個性”,甚至能“玩?!?,為數(shù)字人注入靈魂;三是視覺新突破,這次的羅永浩數(shù)字人直播,是業(yè)內首個多模態(tài)高度融合的數(shù)字人應用場景,實現(xiàn)了在直播實時環(huán)境下的超長演繹,做到了動作、表情、語調等貼合話術,且穩(wěn)定可控;四是效果新突破,AI大腦基于直播間信號靈活控場,數(shù)字人可以主動邀評、高頻互動,極大提升用戶沉浸感;通過多智能體實時調度,在數(shù)字人直播間實現(xiàn)了和真人直播間一樣的互動玩法,如抽獎、發(fā)福袋等;強大的運營場控能力、多樣化營銷手段,有效提升用戶轉化。
百度電商商業(yè)業(yè)務部負責人、數(shù)字人創(chuàng)新業(yè)務部負責人吳晨霞表示,為了支撐本次羅永浩數(shù)字人的突破,慧播星重磅升級了新版本,實現(xiàn)了劇本、動作、聲音、腳本、問答、互動等維度的全方位升級。吳晨霞對羅永浩數(shù)字人的誕生過程進行了揭秘,通過羅永浩、朱蕭木的海量數(shù)據訓練生成數(shù)字人主播,同時結合商品特性與羅永浩人設量身定制直播劇本,實現(xiàn)了神形音容全模態(tài)高度統(tǒng)一,還原了羅永浩、朱蕭木的慣性動作、表情等,做到如同真人一樣自然。在此基礎上,慧播星以大師級的創(chuàng)作能力,生成人物高光片段,復刻羅氏幽默,在直播中能夠接梗、玩梗,使得數(shù)字人表現(xiàn)力有了真人般的魅力。此外,本次突破技術難題的雙人劇本,實現(xiàn)了雙數(shù)字人的默契配合,屬于行業(yè)首創(chuàng)。最后,慧播星作為業(yè)界首家實現(xiàn)「AI大腦」多智能體調度的產品,實現(xiàn)了靈活場控,并支持一個數(shù)字人直播間上線多種玩法,有效提升了用戶轉化。羅永浩數(shù)字人首秀大捷,標志著慧播星產品力邁向全新階段。
背后“黑科技”揭秘:多模協(xié)同的數(shù)字人技術
百度集團副總裁吳甜系統(tǒng)性地介紹了多模協(xié)同的數(shù)字人技術。百度研制的多模協(xié)同的數(shù)字人技術,基于文心 4.5T 實現(xiàn)了融合多模規(guī)劃與深度思考的劇本生成,由劇本驅動數(shù)字人多模協(xié)同,實現(xiàn)動態(tài)決策的實時交互,使數(shù)字人的“神、形、音、容、話”達到高度統(tǒng)一。最終呈現(xiàn)出一個具備高表現(xiàn)力,內容吸引人,人-物-場可自由交互的超擬真數(shù)字人。
她介紹道,劇本生成技術包含臺詞生成、多模驅動和動態(tài)交互三部分。以羅永浩數(shù)字人劇本為例,基于文心大模型4.5 Turbo生成的劇本,充分展現(xiàn)了主播的個人特色,具備典型的羅氏幽默風格,并能夠實現(xiàn)雙人主播的內容協(xié)同,動態(tài)實現(xiàn)豐富的實時互動。通過文本自控的語音合成大模型,實現(xiàn)高復原的語音合成能力,再結合直播臺詞及發(fā)音人特征,合成風格恰當、自然流暢的聲音。為解決羅永浩數(shù)字人直播雙人聲音配合的難點,百度采用對話上下文編碼器,將對話歷史輸入和當前對話進行語音合成的統(tǒng)一推理計算,最終實現(xiàn)流暢、自然的雙人對話效果。在數(shù)字人形象生成以及驅動方面,通過結合多模態(tài)視頻理解、跨模態(tài)信號生成、視頻生成等技術,克服了高可控交互,高精度、長時間一致性保持等難點,實現(xiàn)了高一致性超擬真羅永浩數(shù)字人長視頻生成。
吳甜表示,百度在今年4月發(fā)布了最新的文心 4.5 Turbo和文心X1 Turbo,羅永浩數(shù)字人是基于文心大模型的最佳實踐。百度在大模型技術的持續(xù)探索和創(chuàng)新,將為用戶帶來更優(yōu)質的體驗、為行業(yè)帶來更具創(chuàng)新力的業(yè)務模式。
“AI +直播” 模式開啟電商新想象 超頭主播的數(shù)字人或將涌現(xiàn)
會上,平曉黎正式宣布,羅永浩將正式擔任百度慧播星首席產品體驗官,羅永浩在入駐百度優(yōu)選進行真人直播帶貨外,其數(shù)字人也將不定期開播、常態(tài)化為用戶帶來更多福利。羅永浩的數(shù)字人作為新一代高說服力數(shù)字人的首秀,引發(fā)了用戶側的廣泛討論與行業(yè)熱議,特別是用戶的轉化效果媲美真人,意味著用戶對于數(shù)字人的接受度已經被驗證。
隨著百度電商與交個朋友戰(zhàn)略持續(xù)落地,未來,羅永浩作為超頭主播,也將發(fā)揮引領作用,吸引更多超頭主播加入,共建慧播星數(shù)字人矩陣,中國直播電商的競爭或將迎來新變局。
此外,百度電商還推出兩大計劃:夢蝶計劃將通過流量扶持,超頭主播數(shù)字人打造、預算扶持,實現(xiàn)百度優(yōu)選超頭主播的數(shù)量倍增;繁星計劃則將再次追加10萬個慧播星數(shù)字人,投入1億元數(shù)字人消費補貼、千萬級別的運營扶持,幫助更多的普通人、中小企業(yè)開啟數(shù)字人直播。
據羅永浩所屬機構交個朋友代表、公司副總裁吳加錄表示,百度的AI能力與交個朋友的直播運營經驗和供應鏈資源實現(xiàn)了技術與場景的完美結合,這類“技術+IP”的協(xié)同模式也將為行業(yè)探索智能化轉型提供實踐樣本。
重要提示:本文僅代表作者個人觀點,并不代表樂居財經立場。 本文著作權,歸樂居財經所有。未經允許,任何單位或個人不得在任何公開傳播平臺上使用本文內容;經允許進行轉載或引用時,請注明來源。聯(lián)系請發(fā)郵件至ljcj@leju.com,或點擊【聯(lián)系客服】
樂居財經APP
?2017-2025 北京怡生樂居財經文化傳媒有限公司 北京市朝陽區(qū)西大望路甲22號院1號樓1層101內3層S3-01房間756號 100016
京ICP備2021030296號-2京公網安備 11010502047973號