最先系统接触“人机交互”这个概念是在上大学的时候,有一门专业课《教学媒体与技术》,目前所学知识所剩无几,只记得当时上这门专业课的时候,挺感兴趣的。人机交互——人和机器打交道的方式。git
人机交互的形式大概发生了一下3个方面的升级:github
1.以鼠标和键盘为媒介的人机交互;.net
2.以触摸屏幕,手写笔等为媒介的人机交互;get
3.以语音为载体的人机交互;将来可能有更多的人际交互的形式。it
在这个发展的过程当中,变化最大的实际上是交互从图像到语音的转变。声音承载了人类的思想和情感,图像承载了人类的表象和直觉。可见图形交互更容易获取到用户注意力,人类的第一印象由外表决定的。图像媒介虽然承载的信息量更大, 可是,图形界面的交互须要手指的触碰触发,超过一个手臂的自由操做范围的远场的交互,图像界面可能就会有壁垒。在此,语音交互在必定范围内更有优点。这也是语音交互的最大魅力之一:解放双手!相对于图像交互,语音交互也有其优点所在,可是语音交互依然存在一下问题。基础
语音交互,目前存在的主要问题是:方法
1.语音交互唤醒不天然目前的语音交互唤醒是以发出语音指令来唤醒机器,这种唤醒方式不够天然。生活生的场景下,人人交互会经过声音,手势,肢体动做,距离,唇动来镜像交互。要解决这个问题能够给语音唤起添加更多的唤起方式,多种方式共存来唤起语音交互。经过几个维度来判断被唤起的交互方式,第一个维度能够是距离判断是近场仍是远场;第二个维度是手势,肢体动做;第三个维度是唇动,声音。技术
2.机器人没有情感,交互方式过于呆板机器人的EQ包含两个部分,一部分情绪的识别,一部分情绪的应对。对于情绪识别,经过人脸锁定,图像分析等方法,了解用户的情绪,主动触发;经过天然语言分析的方法,情感词的标记和分析识别用户的情感。对于情绪应对,经过分析用户的输入和多轮对话分析,对用户情绪进行反映。结合前面的情绪识别,能够在对语音语义的理解基础之上,识别在此处语音语义发生的时候,用户的情感是如何的情况。问答
3.机器人的交互行为不够主动,大可能是被动式交互,对话过程不平等;85%的用户对主动交流有期盼,目前机器人的人机交互,多数是经过被动触发的, 不够主动,让使用者感觉不到被关注的感受。同时,在这个过程当中也是不平等对话的机制,只有当机器被触发以后才会与用户产生互动,而不会主动产生识别人的情绪,所谓“察言观色”。这样的不平等的交互也是目前存在的主要问题。语言
目前人机交互主要应用于:聊天,问答,对话这三种场景中。
聊天:机器人被动唤起问答:经过一问一答的形式来表现,目前还缺少深度结合上下文的问答系统。多数是专家系统来呈现某领域的专业知识。