什么是语音识别?

用你的声音作为输入法

语音识别是一种允许对系统进行语音输入的技术。 您可以与您的计算机,手机或设备通话,并使用您所说的输入来触发某些操作。 该技术正被用于替代其他输入方法,如打字,点击或以其他方式选择。 这是一种使设备和软件更加用户友好并提高生产力的手段。

有很多应用和使用语音识别的领域,包括军队,帮助受伤的人(设想一个残疾人或没有手或手指的人),医疗领域,机器人等等。在不久的将来,由于其在电脑和手机等常见设备中的传播,几乎每个人都会接触到语音识别。

某些智能手机正在有趣地使用语音识别。 iPhone和Android设备就是这方面的例子。 通过他们,您可以通过接听诸如“致电办公室”等口头指示,向联系人发起呼叫。 其他命令也可能受理,如“打开蓝牙”。

语音识别问题

语音识别在其被称为语音到文本(STT)的版本中,也被长期用于将口语转化为文本。 正如ViaVoice在盒子上所说的那样,“你说话,它就是类型”。 但是我们知道STT存在一个问题。 十多年前,我尝试过ViaVoice,并且在我的电脑上没有持续一个星期。 为什么? 这是非常不准确的,我最终花费了更多的时间和精力来讲话和纠正,而不是打字。 ViaVoice是业界最好的之一,所以想象其余的。 这项技术已经成熟和完善,但对文本的讲话仍然让人们提出问题。 其中一个主要困难是人们在发音方面的巨大差异。

并非所有的语言都可以用于语音识别,而那些通常不被支持的语言以及英语。 因此,大多数运行语音识别软件的设备只能用英语进行合理的操作。

一些硬件要求使得语音识别在某些情况下难以部署。 你需要一个足够智能的麦克风来过滤掉背景噪音,但同时又足够强大以自然捕捉声音。

说到背景噪音,它可能会导致整个系统失败。 结果,由于不受用户控制的噪音,语音识别在许多情况下失败。

语音识别作为VoIP等新型手机和通信技术的输入方法,而不是大规模文本输入的生产力工具,已被证明是更好的选择。

语音识别的应用

该技术在许多领域越来越受欢迎,并在以下方面取得成功:

- 设备控制。 只需向Android手机说“OK Google”即可启动一个系统,这些系统都是您的语音命令。

- 车载蓝牙系统。 许多汽车都配备了一个通过蓝牙将其无线电机制连接到智能手机的系统。 然后,您可以在不触摸智能手机的情况下拨打和接听电话,甚至可以通过说出来拨打电话号码。

- 语音转录。 在人们必须打字的地方,一些智能软件会捕捉他们说出的单词并将其转录成文字。 这是目前在某些文字处理软件。 语音转录也适用于可视语音信箱