今天咱们就从硬件层面,剖析下VisionPro。希望大家在产业0-1的阶段先做好准备,随时迎接未来1-10的爆发性机会。
其中,显示部分占比最高,达到近50%。主要贡献是两块1.42英寸的MicroOLED内屏,一块350美元,两块合计700美元。
下面主要聊聊VisionPro的几个看点。分别是屏幕、透镜、双向透视、眼动追踪与瞳距调节。
简单来说,VR的光学系统包括显示器和光学元件两部分。显示器为左右眼提供独立成像。光学元件的作用是把屏幕显示的光线调整、放大,最终落在视网膜上成像。
这两部分最终决定了一台VR产品的成像质量、佩戴体验与视觉沉浸感。
上图是VisionPro整个光学成像部分的拆解结构,左下角是光学透镜,右下角就是那块值350美元的屏幕了。光学透镜咱们一会再说,先来聊聊屏幕。
VisionPro的内屏搭载两块如上图所示的1.42英寸MicroOLED面板,由索尼定制。可实现单眼4K分辨率,像素密度高达3400PPI。
举个例子就能体验出强大之处。按照PPI方式计算,VisionPro像素密度是iPhone15ProMax的7.3倍。在一个iPhone15ProMax的屏幕像素中,可以塞进54个VisionPro。
为什么要达到这么高的像素密度。是因为VR跟电视、手机不同,眼睛需要离屏幕很近,越近就需要屏幕越清晰。
XR屏显从LCoS、DLP技术,逐渐向Fast-LCD,MicroOLED演进。
LCoS、DLP,二者技术成熟,性价比高,但成像质量差,功耗高,目前已基本淘汰。
Fast-LCD是当前性价比之选,量产稳定,成像质量中等。2023年上半年Fast-LCD在VR线上市场的占比达到93.5%。但这个技术在总体性能上仍有不足。
MicroOLED是目前可实现的最先进技术路线。也在VisionPro上得到量产使用。
MicroOLED基本在各个维度的性能上都有优势。
首先,MicroOLED像素密度高、对比度高、刷新率高。VisionPro3400的PPI,其他显示技术路线是达不到的。
最后,MicroOLED不需要背光,属于自发光技术。同时将驱动电路与像素阵列集成到一个芯片上。这样就大大节约了空间,降低了屏幕整体厚度,减少重量。
目前MicroOLED在XR上的应用已经取得显著进展。在AR设备方面,2022年MicroOLED出货量已占全球AR头显超50%。
当然,MicroOLED目前最大的问题来自于成本,不过降本是必然趋势。
下面简单聊聊技术原理。微显示技术分为两个大的派别,一个是非自发光技术,一个是自发光技术。
非自发光就是显示材料自己不能发光,需要有一个背光源,代表技术就是LCD。而自发光技术不需要背光,自己就可以发光,代表技术是LED。
LCD由于成本低,技术成熟,目前主要用在中大尺寸面板显示领域,或者一些中低端手机面板上。像素密度呀,对比度呀都不及自发光技术。
在LED技术中,又可分为无机材料和有机材料。用无机材料的叫MicroLED,使用有机荧光材料的就是MicroOLED。
MicroLED理论性能强于MicroOLED,应该是微显示技术的终极状态。但目前在一些工艺上还不成熟,比如巨量转移、全彩化,因此还不能大规模量产。而MicroOLED,虽然成本是高了些,但已经具备商业化能力。
说回到MicroOLED,在原理上与我们常说的OLED是一个意思。都是基于有机发光二极管技术,每颗像素都可以独立发光。
而它们的区别主要有两点。其一,用“Micro”这个词,意味着MicroOLED相比OLED像素更小,像素密度更大,所以适合用在近眼设备上,比如VR。
其二,MicroOLED是在晶圆背板上制造的,而传统OLED用的是玻璃基板。这样一来,MicroOLED采用晶圆级制造,提高了像素间距,将单个像素点尺寸缩小至原来的1/10左右。
此外将传统OLED的玻璃基板替换成单晶硅基板,通过CMOS工艺将驱动电路集成在芯片上,并为每个像素配备输出电流可控的CMOS晶体管。这样可以减少屏幕整体厚度。
上图是MicroOLED的结构图,OLED发光材料直接封到单晶硅片上。在技术上叫做OLED与CMOS的结合,也是无机半导体材料与有机半导体材料的高度融合。
MicroOLED的制造工艺比传统OLED难很多。一方面像素间距小,一方面需要晶圆端与发光端配合制造。
上面是机构整理的MicroOLED全景图。上游是材料与设备,中游是像索尼这种面板制造商,下游是应用。
上游原材料包括硅片、金属材料、有机发光材料、封装材料、彩色滤光层等。其中有机发光材料最核心,目前主要被日韩企业主导。制造设备跟半导体领域类似,比如光刻、刻蚀、薄膜沉积,增加了蒸镀设备。
就拿索尼来说,早在2009年,就开始研发MicroOLED显示技术。2011年发布了首款0.5英寸MicroOLED显示器。目前产品规格方面实现了0.23寸-1.4寸覆盖,分辨率由nHD+突破至2K、4K。
回到MicroOLED整个行业来说。从需求端,如果XR能持续起量,那么MicroOLED显示屏将会实现从无到有的快速增长。
据CINNOResearch预计,2025年全球AR/VRMicroOLED显示面板市场规模将达到14.7亿美元,2021年至2025年年均复合增长率CAGR将达119%。
从技术角度看,微显示技术还有较大的持续提升空间。就拿VisionPro来说,虽然MicroOLED显示屏已经达到了3400PPI,但由于XR是近眼设备,依然不能达到理想状态。
PPI意思是屏幕每英寸的像素数,但它没有考虑观看者与屏幕的距离数据。所以更直观的指标应该用PPD角分辨率,这个指标考虑了距离因素。
也就是说PPI高不代表PPD高,PPI底不代表PPD低,要看距离。
VisionPro的PPI是3400,很高,但是屏幕离眼睛太近了,iFixit测算VisionPro的PPD只有34。而一个64寸4K电视,虽然屏幕的PPI只有70,但如果你在2米远观看,PPD能达到90,秒杀VisionPro。
根据测算,理想状态下,XR屏幕的PPD要在60以上。因此第一代VisionPro还是能感受到屏幕的颗粒感。所以屏幕技术未来还有继续优化与迭代的空间。这也会延续产业的景气周期。
聊完了显示屏,接下来说说光学透镜。在VR中,需要近眼成像,但人眼晶状体调节能力是有限的,焦距达不到那么短的距离。因此在显示屏幕与人眼之间,要增加一组光学透镜,作用是把显示屏光源放大和调整,最终落在人眼视网膜上成像。
VR光学透镜发展到现在,经历了三个技术阶段。最早使用的是非球面透镜方案,如上图所示,明显能看到透镜又大又重,严重影响了用户的佩戴体验。
之后技术往轻薄化方向发展,出现了第二代技术方案,菲涅尔透镜。外观上,从球面变成一个有一圈圈圆环的薄片。
菲涅尔透镜通过去掉原非球面透镜的中心材料,缩短焦距,大幅降低了透镜的体积与重量。可以理解为,菲涅尔透镜就是扁平版的非球面透镜。但问题是成像质量也随之下降。
能不能既要轻薄,也能保持成像质量的技术呢。最新一代的Pancake方案呼之欲出。
Pancake在英语里面的意思是薄饼,是一种形象的理解。意思是说Pancake透镜方案是由一层层材料贴合出来的。
上图是Pancake方案的结构图。我们看到这个组合里面包括透镜、半透半反膜、1/4相位延时片以及反射式偏振膜。
由于这些膜的共同作用,在光路上形成了一种折叠模式。这与非球面透镜以及菲涅尔透镜不同。这样一来可以进一步缩小空间。
上图是三种光学方案的性能对比。可以看到Pancake方案的优势一方面是成像质量好。
另一方面最大的优势是紧凑轻薄。这里用到TTL指标,代表光学总长,Pancake方案可以做到前两者的一半。
最终导致的结果是,Pancake模组厚度可以缩小到菲涅尔透镜的一半,同时减重也能达到50%左右。
此外,使用Pancake方案,可以通过移动镜片组或屏幕改变系统的光学特性,进而实现屈光度调节。这让近视的佩戴者可以不带眼睛,也能正常使用VR头显。
下面简单讲讲Pancake技术方案的原理。
Pancake模组,是利用光的多次折射,实现在狭小空间内的视角放大。根据SDreamLab的两片式Pancake示意图:
显示器发出的光经过线性偏振片和1/4波片,把光线变成圆偏振光。
光线穿过半透半反膜,再经过透镜1与1/4波片,把圆偏振光变成S偏振光。
光线达到偏振分光膜,这个膜反射S偏振光,透过P偏振光,S偏振光被返回。
光线又经过1/4波片,变成圆偏振光,再穿过透镜1,在半透半反膜上反射。
反射的光线再经过1/4波片,变成P偏振光,其后一路穿过偏振分光膜与透镜2,到达人眼。
其中,什么P偏振光、圆偏振光还是S偏振光,指的是光线波动的形态,通过不同角度的偏振片,光线振动的路径可以变成垂直的、水平的,或者螺旋旋转的。
这些不重要,只要知道Pancake是通过半透半反膜,将光线在透镜组中折射放大就好了。
Pancake技术也存在问题,光线过偏振片时不改变光的强度,但过半透半反膜时,光线就会减半。从光的传播路径可知,在Pancake透镜组中,光线先穿过一次半透半反膜,光线减半,之后又反射一次,再减半。最后达到人眼的光强,理论只能达到屏幕发射光强的50%*50%=25%。实际比这个还要低。
由于Pancake方案光效损耗比较大。所以,这对于显示屏提出了比较高的亮度要求。
进一步来说,Pancake方案也在不断迭代。根据镜片数量可分为单片式、两片式和三片式方案。
镜片数量越多,轻薄度就会受到影响。但是镜片数量多,有利于提高成像质量。那如何在轻薄度与成像质量上做到兼得呢,业内采取了贴合式三镜片Pancake技术。
上图是VR光学方案的发展趋势图。未来还会有复合光路、特定光路技术的迭代。当下,贴合式多片Pancake方案是商业化技术制高点。
下面聊聊Pancake方案的成本构成与产业链情况。
Pancake方案部件主要由光学膜、镜片构成。根据成像原理,无论是单片、两片式还是多片式,一台VR至少需要2个反射式偏振膜、4个1/4波片、2个线性偏振片,此外还一些其他光学膜。
根据产业调研,以2PPancake方案为例,镜片、反射式偏振膜、其他材料的BOM成本占比分别为,25%、50%、25%。所有光学膜成本占比超过70%。
再来说制造角度,Pancake方案可以拆分为光学设计、透镜加工、贴膜、组装、检验,最后到封装。
整体上Pancake方案有一定工艺难度。主要在于三点。其一在于设计,需要多方面平衡优化。其二在于材料,反射式偏振膜加工难度高。其三是组装,多片镜片贴合难度较大,良率较低。
光学设计环节,主要参与者是整机商与ODM/OEM厂商,如国内创维、Pico,以及歌尔这种。
反射式偏振膜由于技术难度高,主要由3M、旭化成等海外材料厂商主导。
反向透视的意思是,可以把佩戴VisionPro用户的眼神动态呈现在设备上,投射到每个注视你的人身上。
配合VisionPro的前向透视(佩戴者可以从设备里面看到外面的真实环境)。这样就形成了双向交互,是XR支持社交场景的前提。
VisionPro的反向透视功能,是把用户的眼神动态电子化,之后呈现在VisionPro的一块弧形外屏上,让大家观看。
反向透视的工作原理如上图所示。首先通过红外线摄像头获取用户的眼部动态。然后通过算法进行3D建模。之后将眼神图像用一块弧形OLED外屏播放出来。
最后,在显示屏上,还叠加了一块柱状光栅显示屏,它的作用是把屏幕图像投射到不同角度,他人从各个方向都能看到佩戴者的眼神动态,实现裸眼3D效果。
其中柱镜光栅技术是实现反向透视功能的关键之一。
柱镜光栅是由一系列平行的柱面透镜组成的光学元件。每个柱面透镜都可以看作是一个小的凸透镜或凹透镜。
当光线经过柱镜光栅时,每个柱面透镜都会对光线进行聚焦或发散,使得光线在不同的方向上发生衍射。
最终通过柱镜光栅,VisionPro可以将外屏不同切片投向不同角度,他人在不同角度观看设备,可以看到不同角度的设备佩戴者的眼神图像。
不过柱状光栅也有短板,首先柱镜光栅投射的区域数量越多,那么屏幕总亮度也被分散越多,对外屏显示亮度有要求。
其次,光栅是柱状的,观看者在水平方向移动时,能看到不同的图像。但如果沿着垂直方向移动,则看到的图像是不变。未来柱镜光栅将会向球镜光栅发展。
VisionPro反向透视功能的硬件除了内部的传感器,主要是一块异型AMOLED外屏,由LG提供,BOM成本30美元。
瞳距是指两个瞳孔之间的距离,即Inter-PupillaryDistance(IPD)。瞳距的大小随人的年龄、性别、人种等因素,每个人都是不一样的。
在VR设备中,理想状态下,人眼、透镜和屏幕的中心在一条直线上,看到的画面才是最清晰的。而每个人的瞳距有所不同,因此VR设备就需要一个瞳距调节机制。
VR设备上的IPD调节也在不断精进,从手动调节往自动调节发展,从有级调节往无极调节发展。
自动调节的逻辑是头显设备内通过传感器收集瞳孔位置,自动通过机械结构调整光学器件的位置。
无极调节则是指光学模组可以在一定范围内随意调节,不用像有级调节那样,只有几个固定档位可调。
单目独立自动调节就是每个眼睛都有一个单独的调节机构。可根据左右眼不同需求做精细化的适配。
具体调节方式是这样的。VisionPro内有多个红外线LED照射眼球,摄像头获取眼球瞳孔图像。之后计算出瞳孔位置、大小及瞳距等信息。
之后将IPD数据发送至调节机械结构,驱动微型电机、行星齿轮减速机、丝杠等结构。最后推动光学结构位移,对准人眼。
公司的瞳距调节驱动系统内置瞳距调节推杆电机和调节齿轮箱。电机能将旋转运动转变为推杆的直线运动,带动光学模组按照佩戴者的瞳距自动调节。
在VisionPro发布前,VR的主流交互方式是手柄为主,眼动追踪为辅。而VisionPro却跳过了手柄操作,直接上眼球追踪+裸手识别的高阶交互模式。
在操作中,佩戴者的眼睛像是PC端的鼠标,眼球锁定完成后,配合双指捏合,即可打开新的应用。
整体来说,VisionPro的眼球追踪+手势识别交互体验是得到好评的。相比Quest3的手势识别功能,VisionPro在精确度、精细度以及流畅度上都更为优秀。
能达到这样的效果,首先是硬件方面堆料更足。
VisionPro一共配备了12颗摄像头。其中正面2颗是主摄像头,用于捕捉周边环境,实现前向透视。
接下来,配了前2、下2、侧2共计6颗摄像头,这6个摄像头主要用于手势识别。
其中2颗向下摄像头,专门捕捉手垂放在腿上的视角。为了弱光环境下手势识别准确性,还加入了两颗红外LED进行辅助。
再来说眼动追踪。主流方案由眼动像机、光源和算法共同完成。光源发射红外光在眼角膜反射形成闪烁点。眼动像机捕捉眼睛的高分辨率图像,经由算法解析,实时定位闪烁点与瞳孔的位置。最后借助模型估算出用户的视线方向和落点。
在算力上,VisonPro用R1芯片专门处理12个摄像头等传感器的输入,能在12毫秒内将新图像传输到显示屏中。以超高的精度、极低延迟完成用户的手势和眼球运动。
其实,眼球追踪+手势识别的核心还是在于软硬件适配与算法的优化,是MR主机商做的事情。
还有一个趋势则是硬件的加码,比如摄像头价值量与用量的提升。
最后,放一张券商总结的VisionPro硬件供应商一览表,供大家参考。
那么从产业分工角度,也基本承袭了手机、电脑的供应商。大陆企业的竞争力,也依然是模组、结构件、电池这些环节。那么在VisionPro没有起量的情况下,自然对于供应商的业绩贡献弹性比较小。
当然具体问题要具体分析,这里说的更多是投资的方法与思路。
按照这样的推演逻辑,我们有理由相信,3-5年后当第二代、第三代VisionPro上市,销量会获得快速的增长,MR也将开启普及时代。
而能否这样推演,最核心的问题在于MR产品本身。是否真的能给用户带来体验上的刚性需求。在这个问题上,我是谨慎乐观的,关键需要一个爆发点到来。