近日,观众(zhòng)欣喜(xǐ)地看到在央视网络春晚舞台上,撒贝(bèi)宁有了个虚(xū)拟孪生兄弟“小小(xiǎo)撒(sā)”,这是(shì)AI虚拟(nǐ)主持(chí)人首次上岗(gǎng)与原型同台秀技,这(zhè)让小撒很是感(gǎn)慨——正(zhèng)在直(zhí)面自己(jǐ)的未来职(zhí)业(yè)危机。
portant;" />
据(jù)透露,打造这(zhè)样(yàng)一个AI孪生(shēng)主播,仅需约30分钟。那么,究竟(jìng)其中有何奥妙之处?
如同原型孪生般逼真(zhēn)
是否见过,让撒贝宁“无话可说”的主持对手?
只见,小小撒一出(chū)场,小撒就忍不住(zhù)说:“我的天(tiān),感觉像照镜子(zǐ)一(yī)样。”甚至(zhì)从外貌上看(kàn),直呼简直就是“失(shī)散(sàn)多年的孪生兄弟”。
而(ér)小小撒(sā)也(yě)并非花(huā)瓶摆设,很(hěn)能掌控现场(chǎng),妙语连(lián)珠(zhū),几(jǐ)乎不留余地。以至于一旁(páng)的小撒“委屈”地插话:“能给我说一句吗?”
显然,与以前僵硬、机械形象的(de)虚(xū)拟人技术相比,引入人工智能(néng),按真人原型架构(gòu)出的虚拟主持(chí)人,在技术上有(yǒu)了相当大的提升(shēng)。
“为了(le)与真(zhēn)实的主持人有所区分,技术团队在形象设计上做了一定程度的变(biàn)化。比(bǐ)如,这次可爱的‘小(xiǎo)小撒’个头要高一点,更健谈些。”美(měi)国人工智(zhì)能公司(sī)偶邦(ObEN)联合创(chuàng)始(shǐ)人(rén)郑毅向科技日报记者介绍说。
当然,小小撒也并非独家(jiā)打(dǎ)造,因为节目中除(chú)了(le)虚拟孪生(shēng)撒贝宁,其他主持人(rén)朱迅、高博、龙(lóng)洋(yáng)的孪生AI主持(chí)人也(yě)都纷纷亮相(xiàng)。
本世纪初(chū),英(yīng)国广播公司发布第一(yī)个虚拟(nǐ)主(zhǔ)持人Anaova之(zhī)后,虚拟(nǐ)主持人成了一个科技(jì)研究热点。“能闻其声,也(yě)见其(qí)人”,今年网络春(chūn)晚可谓是这一技术(shù)在国内首次(cì)大规模应用。
用数据“喂养”长大
常言道,“台上一分钟(zhōng),台(tái)下十年功”。而此(cǐ)次培(péi)养虚拟主持人(rén)的过程(chéng)却大(dà)大提速。
记者了解到,打造这样(yàng)一个AI虚拟孪生主播的技术(shù)叫(jiào)作(zuò)PAI(Personal AI),在20多项专利申(shēn)请技术的支撑下,只需撒贝宁等主(zhǔ)持人(rén)的面(miàn)部扫描和半(bàn)小(xiǎo)时(shí)的录音数据,即(jí)可生成形象和声音模型(xíng)。
“在AI语(yǔ)音技(jì)术的基础上,无需主持人(rén)录入大量文(wén)本建立语(yǔ)音数据库。只需其较短的几十句(jù)标准原声,通过特征参数提取,利用迁移学习(xí)算法即可建立其独(dú)特(tè)发声模型。由(yóu)此(cǐ),任何输入的文字都可用主持人的声音读或唱(chàng)出来,甚至能运(yùn)用中日英(yīng)韩四种语言。”郑(zhèng)毅说。
据介(jiè)绍,随着越来越多的(de)数据“喂养”,小(xiǎo)小撒在成长中会掌(zhǎng)握更多技(jì)能,甚至包括小撒的(de)喜(xǐ)好、说话方式等(děng),在(zài)另一层(céng)面上与其更(gèng)为相似。再加上动作捕捉训练,以及(jí)传感(gǎn)器及运动跟踪设(shè)备(bèi),更突(tū)显了原型(xíng)主持人的个性化特色,大(dà)大(dà)增(zēng)强辨识度。
“现在(zài)的深(shēn)度学习和机器学习,是在原有自动(dòng)化规则上多了学习能力——自(zì)己发现规律。换(huàn)言之,由(yóu)于人类很难发现规律中的细节,而(ér)AI可通过大量训练让(ràng)电脑学习去发现内在规律及细节。”华为人工智能算法工程(chéng)师(shī)张侗(dòng)冬告诉记(jì)者。 在某种意义上,正如主持人(rén)朱迅所言,“通过(guò)数据载体(tǐ)的形式,跟真(zhēn)实世(shì)界亲密互动,我(wǒ)们实现(xiàn)了(le)‘永生’。”
从数字世界到(dào)人(rén)类世界的鸿沟
未来的(de)世界是平行的数据世界(jiè),社会的主角(jiǎo)是人,数(shù)据世界的主角是数(shù)字化的人。那么,在人工智能时代,虚拟主持人有什么发展瓶颈?
郑毅指出,“‘情感’是人(rén)类的专利。从语音模拟到语意模拟,虚拟主持人面(miàn)临从数字世界(jiè)到(dào)人类世(shì)界的鸿沟,尽管(guǎn)其在(zài)模仿(fǎng)音色、语速(sù)、停顿(dùn)时都没问题,但是知道意思、怎么回答,却不理解(jiě)感情内涵,要(yào)做到(dào)抑扬顿挫目前还很难。”
据介绍,语意(yì)学习,虽然也(yě)有“兴奋”“悲(bēi)伤”“着急(jí)”等情(qíng)感模型,但在模拟过程中,虚拟主持人不能(néng)及时调(diào)动,需要人工参与。虚拟人(rén)仍然像个嗷嗷待哺的婴儿,人类如何孕育它成长,为其构筑(zhù)怎样的(de)世界观,将是未(wèi)来深入探索的方向。
郑毅表示,相信AI虚拟主持人不(bú)仅是一个技术(shù)产生到技术(shù)落地的过程,也是一个信任交接的(de)过程(chéng)。当初(chū)攻关虚拟主持人技术的一(yī)大初衷,是想通过主持人(rén)、明星这样有一(yī)定公信力人物的(de)带动,增加人们对人(rén)工智能的信任。因为我们还处于(yú)技术(shù)成长阶(jiē)段(duàn),而(ér)未(wèi)来人与人工智能的相处也应从信(xìn)任(rèn)开(kāi)始,例(lì)如(rú)未来像公务繁杂的(de)职场人(rén),如果拥有一个数字化(huà)的另一个自己,模拟自身意(yì)愿,便(biàn)可代劳成为(wéi)贴心助手(shǒu),打理日常(cháng)琐事,是不是会让生活省心很多?相信人工智能可以给我们带来(lái)更(gèng)多生活便利,创造更好的生活。
有业内人(rén)士评价说,今年网络(luò)春晚中AI应用的一小步,可能(néng)将会带来掀开虚拟主持(chí)人时代的一大步。“当然(rán)若虚拟(nǐ)人上岗,工资依然发给我们人(rén)类就好(hǎo)。”有(yǒu)人戏称(chēng)。