在智能家居生活中,人们躺在沙发上通过发出语音指令就可以操控电器,取代了传统的遥控器;在智能驾驶中,人们只要说话就能够控制车辆的相关功能。毫无疑问,语音声控技术的大规模应用使常规机器具有了生物才具备的理解能力和反应力,这极大的便利了人们的生活,非常人性化,不得不说,语音声控技术是科技造福人类的又一典范。但如同大多数新生的科技应用,语音声控技术虽然很美好,但还并没有达到完美的地步。
没网了,怎么办?
语音声控技术是一项与IT技术紧密相关的学问,例如在语音识别中起关键作用的无论是统计模型算法还是深度神经网络算法都十分依赖云计算提供支持,有些甚至连语音数据包也都放在后台数据库中,这就需要搭载语音声控技术的硬件本身具有连接网络的能力,如此才能让语音声控技术真正具有控制机器的能力。然而,在实际使用过程中并不是所有的硬件在任何时间都能够畅通无阻地连接网络,比如在地下停车场、山区、农村等没3G/4G信号的地方,另外即使是手机也有停机和流量不足的时候,此时,语音声控恐将毫无作为。
识别不准怎么办?
以车载导航为例,车载导航语音识别技术的应用往往处在噪音干扰的环境中。比如高速行驶、通行车辆多或机场、车站等公共交通区域,噪音会对语音识别准确率产生很大影响,这对声控系统的语音识别技术及语音降噪技术有很大的挑战。另外,语义理解是影响语音识别准确率的另一个重要指标,例如在汉字中常常存在同音不同义的字词,如何准确识别它们的区别和意义,还有各种偏僻字以及人名等,这些问题的存在也是对语音识别技术的一个重大考验。
不能全局声控,怎么办?
现阶段车载语音声控系统仅仅还处在初步阶段,相当于在一套设备上安装了一个语音应用,而并不是从底层系统支持,所以在使用的时候仅仅只是打开某个应用、导航去哪里、听听歌等,如果涉及到深度应用的子菜单控制如:调节声音大小、调整屏幕亮度等等二级或三级功能,语音声控就鞭长莫及了。
通过以上的不足不难看出,语音识别还不能让人机交互达到像人与人沟通那样简单便捷,在许多场景的应用上也有外在限制,但语音识别这一大趋势已经初具雏形,随着技术的进一步发展,语音声控技术将会更加人性化、智能化。