10.2.2 表情识别

10.2.2 表情识别

人脸表情识别技术是指从给定的静态图像或动态视频序列中分离出特定的表情状态,从而理解和识别心理情绪,进一步实现人机交互。表情识别技术涉及生理学和心理学,具有较大难度,其过程可分为三部分:人脸图像的获取与预处理、表情特征提取和表情分类。表情识别能够根据人的面部表情将情绪量化、转换为数据,从而实现人机交互,可以说从根本上改变了人与计算机的关系。因此在虚拟现实领域应用中具有非常大的潜在价值,也是目前学界和业界的研究重点。

表情识别技术源于20世纪70年代心理学家Ekman和Friesen的研究工作,Ekman定义了人类的六种基本表情:高兴(happy)、生气(angry)、吃惊(surprise)、恐惧(fear)、厌恶(disgust)和悲伤(sad),从而确定了识别对象的类别,其次建立了面部动作编码系统。之后经过数十年的研究和发展,表情识别方面已经取得了一定成果,虽然在商用方面还处于起步阶段,但具有很大开发潜力。

图10.4 Vive面部追踪器

VR领域也早已意识到表情识别技术的重要性,目前在VR产业已经有了表情识别的相关硬件。例如HTC于2021年春季推出的面部追踪器Vive Facial Tracker,如图10.4所示,使用双摄像头和红外照明,精确捕捉真实的面部表情和嘴部动态,能够实时读取意图和情感。据官方介绍,可通过在嘴唇、下巴、牙齿、舌头、脸颊和下颚上的38种混合形态来精确捕捉表情和动态,并且仅有不到10 ms的超低延迟。