10.2.3 语音交互

10.2.3 语音交互

除了手势识别、面部追踪之外,语音交互也是当前最有开发前景的自然交互技术之一。语音交互也称“智能语音交互”(Intelligent Speech Interaction),在语音识别、语音合成、自然语言理解等技术基础之上综合发展而成,指用人类的自然语言给机器下指令,以实现想要达到的目标。语音交互技术是人机交互发展到现今的一种最前沿交互方式,例如苹果Siri、微软Cortana、百度小度助手、阿里天猫精灵等都是此类应用。

市面上也已有支持语音交互功能的VR头显,例如Oculus Quest 2,用户可以通过语音命令来启动设备。与之前需要结合硬件按钮才能开启菜单的方式相比,语音交互更加方便,无须借助手柄就能实现一些简单操作。MR头显Holo Lens、Magic Leap等也都支持语音交互功能。

目前国内外最为知名的语音交互提供商主要包括:Nuance、微软、Sensory、谷歌、苹果、科大讯飞、蓦然认知、百度语音、思必驰等。例如科大讯飞,作为中国智能语音与AI产业先锋,在语音合成、语音识别、口语评测、自然语言处理等多项技术领域都处于国际领先的地位。