在近日的2025世界人工智能大會上,有一個(gè)特殊的機(jī)器人引人注目——由上海理工大學(xué)李清都教授團(tuán)隊(duì)研發(fā)的機(jī)器人“學(xué)霸01”。其被錄取為上海戲劇學(xué)院戲劇與影視(全日制)專業(yè)2025級新生(博士,學(xué)制四年),成為全國首位以“博士”身份入學(xué)的具身智能機(jī)器人。
更早時(shí)候,“學(xué)霸01”就有“雛形”。此前的北京人形機(jī)器人半程馬拉松上,卓益得機(jī)器人的“行者二號”獲得季軍,“學(xué)霸01”正是“行者二號”的優(yōu)化版。
“學(xué)霸01”是如何誕生的?它要怎么完成博士期間的學(xué)習(xí)?畢業(yè)后的“學(xué)霸01”就業(yè)前景如何?紅星資本局專訪了上海理工大學(xué)機(jī)器智能研究院的執(zhí)行院長、卓益得機(jī)器人創(chuàng)始人李清都,由他來揭秘首個(gè)“博士”機(jī)器人的那些事。
“學(xué)霸01”機(jī)器人
學(xué)霸要學(xué)“蘭花指” 還要注入一個(gè)表演的“靈魂”
紅星資本局:當(dāng)時(shí)是什么契機(jī)去研發(fā)“學(xué)霸01”?
李清都:上海理工大學(xué)和上海戲劇學(xué)院(以下簡稱“上戲”)在前幾年就有科技融合的戰(zhàn)略合作協(xié)議,在“學(xué)霸01”之前,我們還合作過機(jī)器人舞臺劇《巨物之城》,這也是全球首個(gè)機(jī)器人舞臺劇,時(shí)長有100分鐘。舞臺劇用到了我們實(shí)驗(yàn)室的各種機(jī)器人,對外公演了很多次,反響都還不錯(cuò)。
在這基礎(chǔ)上,“學(xué)霸01”的誕生也是順理成章的。我們把劇里的兩個(gè)機(jī)器人角色融為了一個(gè),就是現(xiàn)在的仿生機(jī)器人“學(xué)霸01”。相當(dāng)于我們把以往的成果再更深一步,做一個(gè)專門面向表演的機(jī)器人,這也和上戲一拍即合。
這是一個(gè)全新的探索嘗試,有學(xué)術(shù)性質(zhì)在里面,同時(shí)也有非常大的產(chǎn)業(yè)化價(jià)值。本質(zhì)上還是一個(gè)科研項(xiàng)目,“學(xué)霸01”有自己的虛擬學(xué)號,并不占用學(xué)籍和資源。
高校的優(yōu)勢就是有更專業(yè)的資源,我們不光是提供本體,還要為它注入一個(gè)表演的“靈魂”,這需要專業(yè)知識和技能。
紅星資本局:“學(xué)霸01”與一般的人形機(jī)器人有何不同?
李清都:“學(xué)霸01”會更仿生,身體結(jié)構(gòu)仿真,比如腿上是用的肌腱仿生驅(qū)動(dòng),想有“肌肉”就可以有“肌肉”,想苗條就可以苗條。另外它也比較輕量化,操作起來也很安全。
它還擁有“表情頭”,在交互上更加自然,比如眼神和手勢,你會感覺它里面有“靈魂”。
對于“學(xué)霸01”來說,技能分低階和高階,低階技能比如手勢和表情、肢體語言、行走跳躍等等,它現(xiàn)在也在學(xué)梅蘭芳創(chuàng)制的“五十三式蘭花指”;高階技能就是把低階技能串聯(lián),去表達(dá)情感,呈現(xiàn)在表演里。
這些都需要具備專業(yè)的表演知識,以及它自己對戲劇的理解,才能呈現(xiàn)出來。
紅星資本局:完成這些技能的挑戰(zhàn)是什么?
李清都:仿生人形機(jī)器人如果做得不夠好不夠自然,容易引起“恐怖谷效應(yīng)”(當(dāng)人類看到與人類面孔高度相似的非人類物體時(shí),會觸發(fā)一種獨(dú)特的恐怖反應(yīng))。
所以如何讓它更像人類,交互更自然,這些都是比較大的挑戰(zhàn)。特別是,“學(xué)霸01”作為“演員”,怎么達(dá)到專業(yè)演員水準(zhǔn),這對它的要求就會更高。這些挑戰(zhàn)我們都是分階段去解決的。
現(xiàn)階段它的學(xué)習(xí)速度沒有人快,比如老師演示一兩遍,人能看懂,但對機(jī)器人來說,要把各種動(dòng)作都做一遍,標(biāo)注好它才能去學(xué),這樣的話效率就低點(diǎn)。
不過我相信,等到未來四五年,人形機(jī)器人技術(shù)會有翻天覆地的變化,我相信它的思考能力會變強(qiáng),理解能力會變強(qiáng),未來整個(gè)大生態(tài)都會對它進(jìn)行賦能,“學(xué)霸01”到那時(shí)會有機(jī)會達(dá)到專業(yè)演員的水準(zhǔn)。
而且這幾年內(nèi)一定會有新技術(shù)出現(xiàn),現(xiàn)在大模型需要許多數(shù)據(jù)才能學(xué)會某個(gè)技能,但未來隨著AI技術(shù)的提升,也許它的思考能力會更強(qiáng)一點(diǎn),藝術(shù)上的理解力會更好一點(diǎn),就不再需要那么多數(shù)據(jù),小樣本學(xué)習(xí)就可以達(dá)到效果。機(jī)器人和AI技術(shù)在不斷迭代,我們也會把新技術(shù)不斷融入“學(xué)霸01”中去。
李清都
學(xué)霸不用坐課堂 畢業(yè)時(shí)要在某些領(lǐng)域達(dá)頂尖水平
紅星資本局:“學(xué)霸01”如何來“學(xué)習(xí)”?
李清都:現(xiàn)在“學(xué)霸01”也可以唱豫劇、滬劇、京劇等,但體驗(yàn)感還沒那么好。動(dòng)作在連貫性、美感上都差一些,需要我們把專業(yè)人員的動(dòng)作拿來給它學(xué)。
我們最開始是建數(shù)據(jù)集,用純“動(dòng)作捕捉”的方式。比如請京劇演員來表演,我們把動(dòng)作表情手勢等捕捉下來,再去訓(xùn)練機(jī)器人。
未來可能就是它直接“看視頻”來學(xué)習(xí)了,因?yàn)橐曨l里的語料庫數(shù)據(jù)集會大很多,有數(shù)據(jù)集之后再去生成一些表演,呈現(xiàn)出來也會更加自然。
它不需要像我們的同學(xué)一樣坐在課堂里,它只要“帶著腦子”來就行,視頻可以作為它的學(xué)習(xí)語料。
所以“學(xué)霸01”要經(jīng)歷4年的教學(xué),學(xué)會基本動(dòng)作、表演套路和技巧。我們上海理工大學(xué)機(jī)器智能研究院負(fù)責(zé)教它“基礎(chǔ)知識”,打通技術(shù)層面,讓它具備學(xué)習(xí)和表演的能力;上戲楊青青老師也是“學(xué)霸01”的聯(lián)合導(dǎo)師,他們團(tuán)隊(duì)負(fù)責(zé)讓它具備“表演內(nèi)核”,要有表演的能力和作品。
紅星資本局:“學(xué)霸01”在畢業(yè)時(shí)能達(dá)到怎樣的狀態(tài)?
李清都:我希望那時(shí)的“學(xué)霸01”能在某些領(lǐng)域里達(dá)到專業(yè)演員的水準(zhǔn),但不可能是全方面的,可能在某些特色領(lǐng)域里它會超過專業(yè)的演員,達(dá)到頂尖水平。到“博士”畢業(yè),它也應(yīng)該有相應(yīng)的藝術(shù)水準(zhǔn)和作品呈現(xiàn)。
我們通過大模型多模態(tài)感知跟交互,它的能力要能達(dá)到藝術(shù)所要的需求。我們后邊接入的大模型,加上上戲提供的語料庫知識庫,機(jī)器人就要具備創(chuàng)新表演的能力。
比如我們出個(gè)題目,讓它表演一段什么劇,它會經(jīng)過自己的思考然后呈現(xiàn)出來。就好像我們現(xiàn)在用的生成式大模型,比如Deepseek,你給它個(gè)題目寫文章,都可以辦得到一樣。
但這前提是,“學(xué)霸01”要學(xué)會人類的基本表演知識和表演技巧,同時(shí)還能理解動(dòng)作融會貫通,能夠把自己創(chuàng)造的故事,動(dòng)作連貫地表演出來。
4年之后,它能夠形成一個(gè)自己的代表作,能震撼到大家,我覺得就已經(jīng)非常理想。
學(xué)霸不愁“就業(yè)” 戲演好能延伸多場景
紅星資本局:在戲劇或影視方面,“學(xué)霸01”有哪些優(yōu)勢和發(fā)展空間?
李清都:和人相比,優(yōu)勢還是很明顯。比如上海這邊有文化空間,里面專門有戲劇表演的劇場,1個(gè)演員一天要演十多場,人可能會疲憊,但對機(jī)器人來說這不成問題。
它演的也可以“創(chuàng)新”,因?yàn)榻巧强梢匀我舛ㄖ频模瑲v史人物甚至虛擬人物我們都可以實(shí)體化。
而且機(jī)器人也可以表達(dá)人類無法做到的情節(jié),比如前段時(shí)間上海京劇院找我們,希望機(jī)器人能演個(gè)“妖怪”角色,被劈成兩半但還可以繼續(xù)“施法”表演。所以某種程度上機(jī)器人也可以是一個(gè)新道具、替身、特技演員等,人有局限的地方都可以讓它來嘗試突破,這就是在演繹空間上拓展更多維度。
如果表演可以完成得很好的話,那未來給人提供情緒價(jià)值、陪伴等這些場景都可以去做,因?yàn)楸硌?、演戲會涉及很多場景,它如果能把“戲演好”,就意味著各種類似于表演的場景,它都可以做好。
比如在養(yǎng)老院康養(yǎng)陪伴或者居家場景里,它掌握了“表演技巧”,就可以提供情緒價(jià)值,可能做到比人更像人。
紅星資本局:畢業(yè)之后的“學(xué)霸01”能做什么?
李清都:作為一個(gè)仿生人,能探索的應(yīng)用空間其實(shí)非常多,它可以在文旅場景里做一些表演節(jié)目。
它有臺詞功能,可以當(dāng)老師,表達(dá)能力上去之后,它還可以當(dāng)個(gè)陪練,接待、講解、銷售這種也可以完成。
“表演”更多的是把人機(jī)交互、情緒表達(dá)的創(chuàng)新能力、故事表達(dá)創(chuàng)新能力做一個(gè)提升。一旦具備了這個(gè)能力,那在涉及人機(jī)交互的場景里,它都會有更好的體現(xiàn)。
雖然學(xué)的是“表演”,但是它的“就業(yè)”非常廣泛。因?yàn)闄C(jī)器人是一個(gè)“不死的生命體”,它可以學(xué)很多,而且都會積累起來。
人是“單線程”,而機(jī)器人是“多線程”,它可以好多知識同時(shí)在學(xué),學(xué)習(xí)是逐漸加速的。
“學(xué)霸01”就是為了迎接未來人機(jī)共生的時(shí)代,到那時(shí)人跟機(jī)器人之間邊界越來越模糊,就像現(xiàn)在人離不開手機(jī),未來人可能也離不開人形機(jī)器人,所以機(jī)器人將來除了表演之外,也要對人做好服務(wù)。
來源:紅星新聞
原文鏈接:https://baijiahao.baidu.com/s?id=1839788509585127674&wfr=spider&for=pc








