与机器人对话!——初探语音智能交互.pdf

与机器人对话!——初探语音智能交互.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
与机器人对话! —— 初探语音智能交互 我们经常能在科幻影片里能看到各种机器人与人类同台出演, 与人类自由的 沟通交流,甚至比人类更加聪明。 大家肯定想知道这样的人造机器是如何做到的, 我们现在真的能造出这样的机器人吗? 开玩笑, 我在这绝不可能解释好这个问题, 但是从另一个角度简单来讲, 与 机器人交流其实这是通过语音来实现与机器交互, 互动的一种操作, 人与机器人 的沟通其核心的一个方面便是语音的识别, 就是说机器人得先听懂人说话。 那此 文就来浅聊下关于通过语音来实现人机交互的一些问题。 我们先看一个较简单的例子 —— Windows 语音识别程序: Windows语音识别功能主要是使用声音命令指挥你的电脑, 实现离开键盘鼠 标来实现人机交互。通过声音控制窗口、启动程序、在窗口之间切换,使用菜单 和单击按钮等功能。 Windows语音识别功能仅仅限于 Windows 系统体系内的一些 常用操作和指令,并且是与监视器显示辅助来完成整个语音操作。 例如你想用语音通过主菜单打开某个程序,当你说出“开始”后,系统将会 提供一个“显示编号”的区块划分功能, (编号是半透明的,使你能知道此编号 下是哪个程序或文件夹)这样假如你想打开“下载”这个文件夹,你只需说出它 的编号“ 10”,程序就会给你打开“下载”这个文件夹了。这样做的原因一是因 为:如果你需要开启用户自行安装的纷繁复杂的程序, Windows 的语音库里面可 能没有这些程序相应的名称, 会造成识别不准, 甚至无法识别, 二是通过显示编 号,和语音识别编号, 响应指令的效率更高, 因此这样语音配合监视器的分模块 显示大大的提高了用户使用 Windows系统的效率和准确率。 同样,如果你对桌面的快捷方式或文件进行语音操作, 系统将会提供一个称 之为“鼠标网络”的功能,对桌面进行以前区域的划分和自动编号,用语音 +视 觉来提高操作效率和识别的精准率: 在目前 Windows 的语音识别程序中,除文本的语音输入(包括文字和符号) 之外,还包括 16 个常用命令, 9 项常用控件命令, 31 项文本处理命令, 15 项窗 口命令,5 个点击屏幕任意位置命令,以及另外的几组键盘命令。用户所能语音 指挥的也就是围绕这些预先准备好了的命令进行交互操作, 旨在这将有可能提高 使用电脑的效率,和尽可能的把双手从鼠标键盘上解放出来。 与此初衷相类似的我们还能在目前主流的移动设备上能看到语音识别功能 的应用: 然后我们在前进一点, 再想一下假如现在我们要面对的不是电脑, 手机,而 是一个机器人! 一位拟人化, 仿真化的机器人, 对比上面的例子你会很容易发现 它和常用的电子设备的不同之处在于, 它很可能是不会有一个我们通常所见的显 示屏,那以上那些通过语音指令结合屏幕可视化辅助来进行的高效的交互方式在 机器人身上就收到了限制。 在这种情况下你面对着机器人, 你肯定会想它在听我 说话吗?它能听懂我说话吗?我说什么它能听懂?我说什么它可能听不懂?等 等这样一对问题会立即扑面而来。 其实在我们现有的技术水平和条件下, 特别是面向大众商用的机器人, 想做 到像电影里面那种人和机器人自由交流的情景几乎是不可能。 当然我们做一个

文档评论(0)

tianya189 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地湖北
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档