文/VR陀螺 万里

可能不少人还记得前些年由于新冠疫情导致在线视频会议软件需求爆发的情景:2020年2月钉钉的MAU从7000万迅速突破至2亿、海外会议软件Zoom 2021年连续三个季度的营业收入增幅同比增长超过了300%。


(资料图片仅供参考)

在线会议软件爆火,恰逢元宇宙概念盛行,两者开始催生出奇妙的化学反应。比尔盖茨曾指出,“在未来两三年内,我预测大多数虚拟会议将从2D图像转向元宇宙,一个有虚拟形象的3D空间。”

目前很多在线会议软件都进行了元宇宙相关的探索与尝试,如Meta于2021年发布Horizon Workrooms,微软Teams上月底推出了3D头像功能。而近日苹果发布的Vision Pro,其中一大看点也是能够实现3D FaceTime通话。

市面上主打元宇宙会议的平台种类繁多,在体验以及产品打造思路上也各不相同。究竟什么产品才是我们所需要的呢?接下来,陀螺君将对市面上几款不同定位的虚拟会议软件进行体验并逐一拆解,从中一窥虚拟会议软件的技术路径以及发展脉络。

图源:苹果

软件1:佳能Kokomo—手机+头显,玩法类似于MR录制

在很多人印象中,佳能是一家老牌影像设备制造商,但是它在元宇宙赛道也早已经展开了诸多探索。如2021年,佳能推出3D VR影像制作解决方案——EOS虚拟现实系统(EOS VR系统),可用于3D 180° VR视频的创作与直播等场景。去年CES期间,其展示了VR会议软件产品Kokomo,该应用4月底正式上线App Lab,进入了小范围公测阶段。

Kokomo联合创始人Jon Lorentz曾经指出,打造软件的初衷,旨在提供一种能超越现有电话、FaceTime或Zoom视频通话的解决方案,即不仅能在屏幕上看到对方,还能切实感到对方的存在。

玩法上,Kokomo有点类似于PICO去年推出的混合现实录制(MRC)功能,即通过手机端捕捉用户真实影像,然后把影像放置于VR空间中,以实现真实通话效果。为了避免手机拍摄时因为佩戴头显而产生的脸部遮挡问题,Kokomo的解决思路是预先录入用户真实的3D面部表情,然后在通话过程中把脸部表情拼接到上半身,以实现完整显示效果。

左为软件使用示意图,右为理想的VR显示效果,图源:Kokomo

这款软件的优点主要集中在几方面:通过视频录制来取代传统的Avatar,它可以补充用户腿部动作、面部神态细节以及身高等更多真实信息。此外,它还支持3D音频、裸手交互等特性。

陀螺君体验发现,想要顺利实现通话,操作上略为繁琐,需要经历下面四个步骤:①手机APP添加好友;②登陆头显然后绑定手机账号;③在头显端/手机端发起通话申请;④把手机放置在腰部以下的位置以拍摄全身视频。

这款软件仍属于内测阶段,体验上还有不少瑕疵亟待解决。一方面,其抠图算法有待加强,在通话时,用户身体画面是一个图片贴片而非3D立体效果,并且有时候身体周围会有白边现象,观感一般;其次,网络时延大,有时候会出现动作滞后于声音的情况,不排除是网络代理的问题;最后一点,能实现触发完美显示(即在画面中展示用户脸部细节)的条件仍旧较为苛刻,并且用户的脸部细节显得较为呆板。

脱离手机使用时用户会以眼镜+手柄的形式显示,图源:VR陀螺

软件2:Katmai—以浏览器为入口,再造线上办公空间

Katmai是一家混合协作方案提供商,成立于2020年,今年4月筹集了2200万美元A系列融资。在元宇宙办公会议解决思路上,Katmai CEO Erik Braund认为,视频比3D化身更适合同事之间的交流。“使用真实的视频可以传达情感,帮助人们以更自然、更真实的方式建立融洽的关系。”关于这一点,Katmai与Kokomo保持了一致。

图源:Katmai

不过,Katmai并不倾向于开发VR应用,相反,它打造了一套基于浏览器访问的虚拟办公解决方案。简而言之,Katmai可面向各大企业开发其3D版本的虚拟办公室,里面设立了会议室、私人办公室、茶水间等不同区域,以尽可能还原线下真实的办公场景。

用户登陆后,他将以一个圆形视频镜面的形象呈现,用户可以在里面的3D空间中自由走动探索,如果在路上遇到同事,还可与之进行交流。Katmai的虚拟办公室力求真实,如用户可以透过虚拟玻璃门看到会议室里面的用户,当关闭虚拟门时,能有效阻断声音的传播,以保证私密性。而在会议过程中,里面同样配备了类似于共享屏幕、文字聊天等2D会议软件常见的功能。

图源:Katmai

Braund透露Katmai的解决方案瞄准的是一些小型或初创公司,它能够消除物理投资空间的巨额成本。陀螺君认为,Katmai等解决方案的出现,或许能够给远程办公的人提供部分线下办公的“温暖”。Kaimai的客户之一TMS的首席创意官曾在一份声明中指出,“在虚拟办公室中聚在一起可以实现更深入的联系、实时协作以及获得自发性的乐趣,这在以前我们的远程工作流程中是无法实现的。”

软件3:Workrooms—主打数字人,内置多种脑暴工具

Workrooms是Meta于2021年所发布的一款VR办公会议软件,主打“会议+个人办公”两大场景,这里着重介绍它的会议表现。

软件使用前,需要创建个人Avatar形象。由于技术限制,目前Avatar只能显示用户的上半身,如果结合Quest Pro使用,里面还可以进一步补充用户的脸部以及眨眼等表情信息。

去年扎克伯格发布的元宇宙自拍照引发了一众吐槽,原因在于里面的Avatar系统建模粗糙甚至不及十多年前发布的《第二人生》。但陀螺君认为,Avatar细节真实性只是影响沉浸感的其中一环,得益于Workrooms优秀的物理引擎以及交互设计,最终能够实现相对不错的沉浸式会议体验。

Workrooms的虚拟办公空间,图源:VR陀螺

Workrooms里面配备了6 DoF以及空间音频技术,用户可以通过转头等方式查看同事的肢体语言并且通过声音了解环境的相对位置。此外,Workrooms倾向于采用手势交互,可以脱离手柄实现更多自然操作。

Workrooms里面配备了小型会议、分组交流、讲座等多种会议场景模板,最高可以容纳16名VR用户同时在线。此外,它还支持非VR用户以网页的形式接入,会议用户人数上限为50人。去年Connect大会上,Meta宣布与微软合作,未来Workrooms还将支持链接Teams。

工具方面,Workrooms提供了三种办公解决方案:①每一名用户都有专属的办公桌面,桌面上配备了一个记事板,用户可在记事板上记录会议日程、想法等;②用户可以通过串流电脑使用,电脑屏幕会在虚拟会议室中呈现;③里面配备了共享虚拟白板,会议主持人或者分享者可以在上面共享图像、表格、PPT、电脑屏幕等内容。

图源:Meta

软件4:Vision Pro 3D FaceTime,主打写实、低上手门槛

不出意外,FaceTime也成为了Vision Pro的一大重要卖点。在3D通话解决方案上,苹果倾向于走写实路线,M2+R1、LiDAR+结构光的硬件组合给它带来了得天独厚的优势。

使用前,用户需要先把脸放在头显面前扫描录入,即可快速生成一个专属的写实风Avatar形象Persona。在通话过程中,头显通过内外摄像头分别捕捉用户的眼神以及嘴唇信息,再交由AI驱动脸部模型生成连贯的交流动画。

苹果透露,里面使用了解码器神经网络,并针对“数千人的不同群体”进行了测试。Persona同样没有躯干以及腿部细节,不过在沟通交流过程中可以录入手势动作信息。

根据一些外媒分享得知,3D FaceTime的人脸表情有时候看起来会略为僵硬,The Verge体验后表示,“在通话过程中会有种恐怖谷的感觉,人脸除了眼睛和嘴巴大部分区域都被冻结了。”不过也有很多媒体给予了相当不错的评价,他们认为通话时感觉很真实。

图源:苹果

根据苹果介绍视频,在FaceTime通话时,用户是以真人大小呈现的,里面配备的Spatial Audio有助于提升聊天的真实感。此外,在通话过程中,用户可以在空间中打开网页、PPT等更多应用,可以很好满足会议等场景。而Workrooms则需要串流电脑才能实现这一点。

作为苹果的一贯强项,iPhone、iPad等设备自然也可以无缝接入到Vision Pro的FaceTime当中,不过他们会相应以2D的形式呈现。

图源:苹果

软件5:Webex Hologram—光场全息成像

Webex是一家视频会议的“鼻祖级”企业,于1996年成立,2007年被思科收购,同年它占领了全球视频会议市场高达53%的市场份额,值得一提的是,如今视频会议软件的头部企业Zoom的创始人袁征也是出自于Webex。

2021年,Webex发布了其最新的AR会议解决方案Webex Hologram。与前面所提到的基于VR头显或者网页版的在线会议解决方案不同,Webex Hologram在呈现效果上更为科幻,它结合使用了AR+全息技术。

会议效果图,图源:Webex

在实现原理上,与会者需要使用采集设备来记录三维图像,紧接着系统对图像数据进行压缩、上传云端最后再传输到另一个用户的显示设备当中,以完成通信。全息技术的呈现方式有很多种,如纹理贴图、点云等,Webex Hologram采用的是光场方案,近日谷歌所发布的Project Starline最新原型所使用的也是这套技术方案。

Webex Hologram现已面向部分企业展开了超过700多次演示,并且完善搭载了12颗摄像头的最新采集原型设备。Webex暂未透露这套方案的成本售价,不过参考谷歌Project Starline,后者的图像采集端与显示端结合在一起,售价超过了1万美元。

产品演示,图源:Webex

总结:五款产品各有优劣,真实性以及易用性会成为重要诉求

一项研究表明,人类沟通方式主要是语言和动作,其中语言表达占45%,表情动作占55%。而语言表达里的文字内容占20%,语音语调占80%。这项研究背后可以反映,林林总总的办公会议类应用,除了解决远程办公跨区域协作这一底层需求外,尽量朝着沟通信息保留的最大化所发展。在这个过程中,以VR/AR、数字孪生、云计算、人机交互等元宇宙技术赋能会议应用,会是它下一个重要的发展方向。

由于新冠疫情因素助推,视频会议类应用市场经历了一段高速发展期,一些调研数据显示,该市场目前依旧具备很大的增长潜力。Zippia的研究表明,74%的美国公司正在展开或计划实施混合工作;IDC预测,2025年全球视频会议市场规模将达到212.1亿美元,2021-2025年的复合增速为17.5%。

我们回顾前面五款应用:佳能Kokomo、Katmai、Workrooms、FaceTime以及Webex Hologram,其实可以发现这五款应用的特点以及差异化都十分鲜明,这可视为元宇宙视频会议应用在不同方向的探索。如果以成本优势、技术成熟度、拟真感、沉浸感、易用性五个维度来看,它们各有优劣,并不存在所谓的“五边形战士”。

评分仅作简单参考,图源:VR陀螺

拆开来看,Katmai这款产品更像是常见的在线视频会议的延伸,除视频交流以外,它还进一步补充了虚拟空间的角色,并且可以使用网页接入,易用性也不错。不过相较于其他几款产品,它的沉浸感一般,究竟有多少企业需要这一3D办公空间,还需要市场的进一步验证。

佳能Kokomo和Workrooms本质上都是VR应用,但是它们的侧重点并不同。前者希望在沟通时能以真实优先,以真实视频为重点,里面甚至完全摒弃了Avatar系统。只可惜目前这款软件还存在不少Bug,并且2D人物贴图结合3D背景有时候容易让人感到出戏。

Workrooms是一款以Avatar为切入点的VR应用,在呈现效果上相对比较饱满,并且功能也比较丰富。不过Avatar的卡通化问题从短时间来看依旧无解,有些人非常讨厌这个“第二身份”,并且需要佩戴笨重的头显设备使用,对于很多用户而言是一种负担。

图源:Meta

Webex Hologram在呈现效果上可以视为较为终极的解决方案,全息视频呈现最符合我们的日常使用直觉,并且还可以进一步实现远程协助等操作。不过,从当前来看,光场等3D全息技术仍未成熟,参考Project Starline,它的成本高昂,体积庞大,并且仍需解决显示分辨率一般、3D区域可视角度偏小等问题,目前这套方案想要大范围推广仍不现实。

最后再聊一下Vision Pro的FaceTime,强大的硬件支撑让它能够轻松实现写实Avatar驱动以及多屏会议办公等传统VR一体机难以胜任的工作,并且无论是从扫描录入,又或者是通话交流的方式上,它实现方式非常自然,几乎没有上手门槛。当然,需要佩戴笨重的头显使用目前也是硬伤,并且3499美元的价格想要说服普通消费者买单其实并不简单。

随着技术的进步和社会的发展,我们有理由相信元宇宙会议应用将在不久的将来成为我们生活中不可或缺的一部分,企业八仙过海,市场大浪淘沙,未来又会出现怎样的元宇宙会议应用,有待时间揭晓。

推荐内容