作者 | 董温淑
来源 | 孙春芳
2023 年,凯发app市场柳暗花明。meta、苹果接连发布了自研 mr(混合现实)头显产品。此外 chatgpt 代表的大模型技术飞速走红,让市场看到了元宇宙生态重焕生机的可能性。
在此之上,虚拟数字人也迎来新的市场机遇与挑战。如果说在未来一段时间内,头显类硬件设备将被视为进入元宇宙的入口之一,那么虚拟数字人则是创造元宇宙生态的第一要素,是元宇宙内容生态创建的关键一环。
面对新的产业机遇,许多虚拟数字人企业动作迅速,试图抓住机遇。这样的背景中,我们试图探讨 meta、苹果等大厂的新动作为产业带来了哪些 " 涟漪 "?ai 技术的加持可能带来什么新玩法?
本期《市界面对面》,我们就上述话题与天娱数科集团 ceo 徐德伟进行了一次深度交谈。
天娱数科是国内知名数字科技公司,其旗下虚拟人产品已落地在代言、短剧、活动、数字员工、电商主播等领域。
市界:6 月 6 日苹果发布的 mr 头显 vision pro 引起热议,但在过去很长一段时间中,vr/ar 市场始终都没有发展起来,而是局限在发烧友、极客人群以及专业应用市场。是什么阻挡了此类应用的发展和普及?
徐德伟:技术的发展和设备的高昂成本都是限制它普及的重要原因,内容和应用场景的缺乏也导致了用户的兴趣和需求无法得到满足,限制了市场的发展潜力。
在这几个问题里,技术问题是首要问题。
xr(vr/ar/mr 统称为 xr)技术还没有经历长期积累,设备的精度、性能、便携度等方面都有待改进,而这些都会影响到内容的质量和用户体验。比如在 vr/ar 头显发展历程里,早期面临的一大问题就是给用户带来的眩晕感。因为如果头显比较重,就不可避免地会给使用者眼部带来较大的压力,造成不好的体验。
虽然有苹果、meta、pico 这些头部公司在不断进行技术创新,也推出了相关的硬件产品,但行业内还没有一款可以真正被称为 " 标杆 " 的产品来给市场上的其他玩家打样,所有人都是摸着石头过河,真正的刚需还没被开发出来。
▲(图源 / 视觉中国)
市界:最近一段时间 "iphone 时刻 " 这个词特别火,苹果 vision pro 发布时有人说这是 vr/ar 市场的 "iphone 时刻 ",您怎么看苹果推出 vision pro 的意义?
徐德伟:相比此前市场主流的 vr/ar 产品,苹果的 vision pro 的定位是 mr 头显。mr 设备在处理器性能、图形渲染能力和电池续航方面会优于 vr/ar,它的显示技术、人机交互设计和生态系统方面都会比 vr/ar 设备有更优的性能和体验。
从积极的角度看,vision pro 现阶段的概念发布昭示了新一轮空间计算的新格局。比如苹果头显的发布有望推动 vr 和 ar 技术的发展,引发更多用户对相关领域的兴趣,从而增加对 ai 数字人和相关内容的需求,为 ai 数字人业务和内容社区带来更多技术创新的可能性。
另一方面,vision pro 亮相也会加速国内 mr 市场的竞争。在苹果产品正式上市之前,市场上所有的相关厂商都会加大在 mr 技术研发方面的投入,提前布局包括硬件设备、软件开发、算法优化等相关产业链。天娱数科后续也会持续关注市场动态,在业务快速发展的同时,也能做到及时调整。
不过,我们还要从整个行业发展的角度来理性考虑,苹果的头显毕竟还是概念性发布,在设备的轻量化、成本结构的优化、产品良率的提升这些方面还有许多路要走。现阶段来看,xr 头显设备并不是一个大众级的消费市场。
▲(虚拟场景 " 火星计划 ",图源 / 天娱数科)
市界:目前 chatgpt 代表的 aigc 技术突破,可能为虚拟数字人乃至整个 xr 内容生态的发展带来哪些影响?
徐德伟:aigc 技术对虚拟数字人的智能化和交互能力的发展有极大的促进作用,不仅能让虚拟人的外形更加精细、逼真,在语言交互方面也能更加自然、真实,带来更沉浸式和个性化的体验。制作流程上,有了 aigc 技术的加持,虚拟数字人的创作将变得更加快捷高效,比如可以自动生成 xr 场景、对话脚本、角色台词等。
我们认为随着技术发展,数字人会在某些层面超越现实人,由这些数字人构成元宇宙世界也将既可以映射现实世界,又能超越现实世界,为元宇宙的真正到来提前进行准备。
ai 技术的加持还为虚拟数字人创造了更广泛的应用场景,我们认为,最有前景的场景就是 " 虚拟数字人陪伴 "。
从需求端来说,现代社会中工作压力极大的企业员工,往往需要借助宠物去满足情感需求,但宠物毕竟不能和人类进行语言互动;再比如许多老年人非常渴望日常有人陪着聊聊天;青春期学生面临的问题往往对父母难以启齿……这种情况下,他们实际需要的是一个值得信赖的 " 第三人 ",虚拟数字人正可以承载这一角色。其中,特别是老年人陪伴市场,有着广泛的应用空间,这也是我们选择的赛道。
目前来看,大模型技术方面国外仍然有着比较大的领先优势,但国内大模型的陆续推出和迭代正在逐渐缩小这种差距。在技术尚未成熟的阶段,内容生态的发展势必会受到一定限制,比如场景的打造、虚拟人的形象和交互能力,以及自动生成内容的精度、细节等等。但这些问题都能随着时间的推移得到解决。
市界:消费者对 xr 设备的吐槽集中于 " 内容少 "。从供应商角度,要做好 xr 内容生态的搭建有哪些关键点?
徐德伟:一个良性的内容生态,需要的是持续的输出。
天娱数科已经和一些 xr 企业达成了合作。在虚拟内容创作等环节,能够持续输出的关键点是虚拟数字人的生产和运营。
生产角度,要能够把虚拟数字人低成本、短周期、批量化地生产出来。虚拟数字人的发展可以分为这么几个阶段,最早的是静态的数字人,无法满足用户的互动需求,只有展示功能;接下来是动态的数字人,能够满足用户对虚拟世界的互动需求,但需要有一个 " 中之人 " 在其中驱动。这种 " 虚拟躯壳 中之人灵魂 " 的模式,本质上其实和打游戏区别不大。而且数字人对 " 中之人 " 的需求,也限制了其批量化、标准化的生产。但在 2021 年左右,我们看到了虚拟数字人发展的一个新方向,就是智能型数字人,也就是它能够做到完全地自主化生产,摆脱对 " 中之人 " 的依赖。
这种自动化、智能化的生产流程,是包括天娱数科在内整个行业的努力方向。2022 年 chatgpt、gpt-4 的横空出世,也让整个行业看到了智能型数字人到来的机遇。
我们 2021 年成立的子公司元境科技,主要业务是围绕虚拟环境、人物角色、物体模型的自动化生产。元境今年初发布了 "metasurfing- 元享智能云平台 ",本质上也是结合 ai,为用户提供低成本、一站式的创作工具。
▲(图源 / 天娱数科)
运营是生产的下一个环节。2022 年我们又成立了子公司元圆科技,专注虚拟数字人 ip 的运营服务。
数字人制作出来之后,怎样去做呈现?怎样吸引用户?怎样去变现?这些问题是与运营强相关的,考验着团队的持续创新能力。
举一个例子,我们的虚拟人形象 " 天妤 " 和抖音合作推出了 12 集敦煌题材短剧《千壁寻踪》。在短剧的制作过程中我们要做到一个月至少三更、四更。基于这种持续不断、高频的一系列内容更新,最终才能让虚拟数字人产生 ip 价值。
总而言之,运营能力的高低,决定了数字人能否体现出自学习能力,有没有 " 有趣的灵魂 "。从这个角度来看,相比制作数字人,运营的重要性有增无减。
▲(数字人 " 天妤 ",图源 / 天娱数科)
总结来说,天娱数科在技术创新、内容开发、场景应用等方面都有布局。技术方面我们旗下的元境科技一直在不断创新内容创作平台,开发新的功能,以降低开发门槛加速内容创作。利用 aigc 技术结合机器学习和深度学习算法,通过分析和学习现有的数据和模式,自动生成虚拟环境、人物角色、物体模型等内容元素。运营方面公司旗下的元圆科技是专业的虚拟人 ip 运营服务商,有众多成功案例经验,在虚拟人 ip 的打造和定制化运营方面都可以提供高质高效的服务。
(注:" 中之人 " 词源日本,最初指的是特制的角色皮套里面的真人演员,现在也用于指代为虚拟数字人提供动作捕捉、声音来源等的幕后表演者。)
市界:目前面对内容的竞争性问题,steam、oculus、pico、viveport 等 xr 企业不同程度地选择了独占性策略。您怎么看未来 xr 内容生态市场的发展?是更看好手机代表的开放生态之路,还是 switch 等游戏主机的独占策略?
徐德伟:我认为一定是前者,走向开源的路线。
如果想要耕耘一个足够大的市场,开放是必须的前提,因为一家企业不可能穷尽所有的技术储备和满足所有的用户需求。但是在开源的基础上,第三方的开发者、用户也能基于这个平台去发挥创意、实现个人的价值。
基于这个思路,我们会成为提供工具的一方。我有一个观念是我们要认识虚拟数字人,驱动虚拟数字人,最终要更好地去使用虚拟数字人。因为虚拟数字人一定是跟我们的工作、学习紧密结合的,最终成为一个人人都能用的消费级产品。
天娱数科一直在积极布局 xr 内容生态领域,公司旗下的虚拟人矩阵已经在各行各业有了具体的落地应用,比如代言、短剧、活动、数字员工、电商主播等等。
防范风险,企业要同步建立纠错机制
市界:虚拟人、xr 技术的迭代一方面拉开了新技术时代的大幕,但同时也有一些声音担忧虚拟世界对现实世界造成的冲击、虚拟世界规范缺失等。从企业角度,怎样规避技术发展可能带来的负面效应?
徐德伟:天娱数科的首要目标是让技术普适化,通过技术研发和落地探索让人们首先把它用起来。虚拟数字人的未来一定是在很多环节中取代真人,但这种取代是指在应用场景中的特定任务的取代,比如保险销售、新闻主播,用相对低廉的价格和技术成本,让它完成任务。
新技术应用往往先于规范。作为企业来说,我们在进行技术和应用的探索创新的同时,在有用、有益的方向进行引导,提供市场需要、行业需要、社会需要的服务。同时,我们也会进行风险评估,及时识别和评估技术发展可能带来的负面效应,并制定相应的应对措施。定期监测技术的影响和演变,以便及时调整战略和行动计划。着眼未来,在重视防范风险的同时,也应同步建立容错、纠错机制,努力实现规范与发展的动态平衡。
今年 4 月,国家网信办发布《生成式人工智能服务管理办法(征求意见稿)》。相信建立健全保障人工智能健康发展的法律法规、制度体系、伦理道德等多层次规范应用指日可待。
商业化,虚拟数字人要成为消费级产品
市界:具体到各个场景,怎样让公司的虚拟数字人真正落地?
徐德伟:我们把所有的虚拟人制作技术做了集成,打造出元享智能云 saas 平台、和 ai 中台等平台,在这个过程中结合产业做落地。
可以用直播行业为例来理解。我们总结了国内直播形式的变迁:最早薇娅、李佳琦代表的直播形式,我们称之为 " 填鸭式 " 直播,过程中主播语速很快,快速讲完产品介绍,再上链接让大家买买买;后来董宇辉代表的直播形式,可以被称为 " 鸡汤式 " 直播,董宇辉靠他强大的知识储备和语言表达,在销售产品的同时引起消费者的情感共鸣。
但是,直播主播不可能人人都是董宇辉,像他一样有强大的知识储备量。所以我们提出,虚拟数字人可以被用来打造一种 " 穿越式 " 的直播形式,也就是让虚拟数字人穿越到直播间当中跟真人主播互动。这种虚拟数字人储备了特定产品领域内的强大知识,能够弥补真人主播的不足,又能自然地和真人主播、观众互动。
市界:目前来看,数据流量、电竞游戏业务仍是公司最主要的收入来源,请问公司对虚拟数字人这部分业务有着怎么样的期待?
徐德伟:市场角度来看,我们一定致力于瞄准这个市场的头部位置。
新生事物的诞生一定会催生一大批与它同步的企业。目前虚拟数字人市场还是非常火爆,可以看到无数的玩家都涌进来,用不同的思路在做。我们还是坚持在生产制作、ip 运营方面保持优势,持续去输出优质的内容。
收入方面,未来虚拟数字人这部分业务一定会成为公司又一个营收支柱,只不过是时间长短的问题。
事实上,今年整个行业的收入都因为大模型的出现发生了比较大的变化。所有大厂的方向都集中在这里,而且生成式大模型和虚拟人天然有结合的潜力,为我们开发 ai 数字人应用提供了无限的可能,也为这部分业务成为公司新兴动力与第二增长曲线提供了可能性。
应用上,我们希望虚拟数字人成为消费级应用,我们要打造的是具备形象真、交互真、思想真的 ai 3d 超写实虚拟人。
目前,我们正在的研发 4d 点云和拓扑 mesh 绑定技术,能检测到用户面部上百个点,然后根据点与点之间的相关性来驱动面部表情,让虚拟人的表情、交互更加自然,突破数字人的恐怖谷效应,同时让虚拟人有记忆、有灵魂、能感知。并通过简单易用、成本低廉的平台产品,降低用户使用虚拟人的门槛,为行业赋能的同时实现数字人的普适化。
市界:目前公司旗下的虚拟人矩阵已经在一些行业有了具体的落地应用,这部分业务的投入产出比怎么样?
徐德伟:要让虚拟数字人成为一个人人都能用的消费级产品,这是我们的目标,但实现目标需要一个过程。
我们现在不太注重说一定要短时间内实现什么样规模的营收,现阶段的重点还是在降低虚拟数字人的使用成本,保持我们在这个赛道中的差异化优势。
不过可以透露的是,其实从 2022 年成立到现在短短几个月,我们的虚拟数字人运营团队已经达到了盈亏平衡点。