• 2008-04-29

    [笔触]下一代人机接口技术的起点(人机交互论文) - [笔触]

    版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明
    http://www.blogbus.com/sgzxy-logs/19968939.html

          更正一下,这不叫论文,这叫吹水文。有兴趣的也一起吹吹水,头脑风暴一下。

    下一代人机接口技术的起点

    关键字:人机接口技术、触摸、肢体语言、语音

     正文

             作为一个关注人机接口技术发展而本身缺乏人机接口硬件技术知识储备的人,我在目前的视野中所见的来自三家公司的上市产品是让我感到由衷振奋的:Apple的多点触摸手势产品系(iPhoneiPod TouchMacBook Air等)、MicrosoftMicrosoft Surface、任天堂的Wii游戏机。这三家的产品在向我们揭示三家公司雄心的同时,也在预告下一代人机接口技术的主流走向和技术实现的可能性。在此,我将我自己目前所见的这一切归结为一个“起点”:如果说真的有下一代颠覆传统键盘、鼠标和各种笨重输入输出设备的人机接口技术存在,那么现在毋庸置疑,我们已经真正踏上征途的起点了。

    当然,只是起点。

    下一代人机接口技术的主要内容,依我所见有三个:实体或虚体触摸交互、肢体语言交互和语音交互。以下就将从目前这三者的现状出发,谈谈它们未来需要达到的目标。

     

    一.实体或虚体触摸交互

    触摸屏这一事物本身虽然诞生已久,但是其概念之下的硬件和软件发展都有了数代的进步,目前的发展成果已非早期触摸屏可能比拟。同时我们在许多科幻电影中最直观体会到的未来人机交互效果就是站在先进的触摸屏前用手势操纵一切功能和数据,而到了今天,我们看到AppleMicrosoft以及更多的公司正在竞争着将过去的科幻带入今日的现实。其中多点触摸技术正在成为一个竞争焦点。

    似乎是Apple在便携式产品中最早展现多点触摸的效果,iPhone其实涉及多点触摸较少,而是随后的iPod TouchMacBook Air将其大放光彩。MacBook Air在笔记本电脑触摸板上实现的多点触摸无疑将成为两代人机接口技术之间一个非常合理的过渡应用。

    Microsoft在我看来则走得更远。Microsoft Surface通过一种桌台式电脑的实现,除了在多点触摸手势上的惊人效果外(允许十余人同时操作),更把触摸屏的能力延伸到物理体之间的交互。通过RFID电子标签和侦测摄影机技术,Surface让现实物品的实体(如手机、数码相机)可以非常直观地与数字信息发生互动,从而让我们现在所习惯的有线连接方式变得过时。我认为这一点对于实体触摸交互来说是革命性的,因为打破虚拟世界与现实世界之间的隔阂,将是触摸技术的一个终级目标。

    至于所谓“虚体”触摸交互,我们现在所见是虚拟激光键盘的上市。这一产品在便携式人机接口技术方面将是一个极大的进步,然而“虚体”触摸技术的远景要比这大得多,而技术上的困难难以言喻。

     

    综合以上一些目前的“触摸式”人机接口技术的实现,除了很显然的成本和体积问题需要随着技术的进步逐渐解决之外,还有一些关于这类型技术的缺陷和远景:

    第一个缺陷是,不是所有操作都适于用“触摸”来解决,有些操作甚至是极端不适合。比如文字输入,通过触摸方式实现(手写)的效率是不可能与键盘比拟的。因此,即使触摸技术得到非常大的普及,键盘这一形式似乎都应该有必要的延续性。当然键盘可以通过触摸屏的虚拟方式得到体现,但是在光滑平面上敲击虚拟键盘的感觉也是无法与敲击机械键盘相比的。所以,除非触摸屏材料有非常重大的突破(比如可变形),物理键盘在将来很长一段时间内都将存在下去。

    第二,“触摸”未必是一种省力的操作方式。跟触摸技术相比,鼠标操作的确显得充满局限和不够自然。但是鼠标的使用很“省力”,用户的手只要在很小的范围内移动即可完成绝大部分的操作。触摸技术所要求的用户双手的运动,就目前的实现模式来看都是难以避免的“费力”。因此我个人看来,也许只有当目前的软件系统的样式有彻底改变,触摸技术才能取代鼠标成为更优秀和实用的通用解决方案。这究竟是什么意思呢?比如我在一张有触摸屏的桌上看数学书,我发现需要张草稿纸时,我激活桌面的触摸屏,很快地在屏中“抽出”一张草稿纸,然后用手中的普通笔直接在上面“书写”,写完一个表达式后屏中会自动算出结果,我得到结果后把草稿纸推到一边消失。在这一个操作中我的确使用了电脑软件,但软件的启动和运行形式将完全的自然化(而非现在所习惯的命令行、窗口、任务栏之类的)。只有结合着这种软件界面的发展,触摸技术才能在真正意义上取代鼠标。

     

    二.肢体语言交互

             我们在判断一种人机接口技术是否可能成为下一代的技术时,最重要的标准是在于它是否符合人的要求,简单来说即是否能强烈吸引人去使用它。随着任天堂Wii游戏机在北美销售冠军的确立,肢体语言交互成为下一代人机接口技术的一种已毋庸质疑。

             Wii游戏机上我们可以简单地预见,肢体语言交互将在未来越来越深地影响游戏娱乐方式,同时在体育训练模拟中发挥作用。然而随着夏普和三星都开始发布能识别肢体语言的手机,人们才开始意识到这一技术是可以全面地进入我们的生活的。

             相较于上面所提的触摸方式,肢体语言交互可以打破简单的手指运动交互,让人体的其他自然行为参与进来,让人们甚至可以不用注视界面即可完成许多操作。因此,当肢体语言交互技术进入我们生活中的各种小型电子产品时,应该是作为触摸技术等下一代主流交互技术的一个补充,而非取代者。

             肢体语言感应的技术目前已经达到了一定的成熟度(Wii的优秀表现就是明证),但仍然在进一步发展中。我相信除了感应的准确度和灵敏度之外,肢体语言交互技术发展的另一个必须解决的问题,是如何恰当地选择参与交互的肢体语言,并建立工业规范。

             而随着肢体语言感应技术发展的还应有电子反馈技术,显然只有后者的不断成熟,才能将前者的应用拓展到更大的面上。

     

    三.语音交互

    这一技术早已不显得新鲜,它成为下一代人机接口技术中必不可少的组成部分也无人会质疑,但是经过这么久的发展后,它仍然走在努力发展的道路上。

    语音交互所面临的最大两个问题是音频的识别和语义的理解,前者目前基本都建立在预先采样的方法上,而后者则涉及到人工智能领域的关键难题。从我个人理解的角度来说,语音交互发展的水平将体现人类人工智能达到的水平。音频识别的高识别率依赖于特定用户的预先采样这一前提很大程度地阻止了语音交互的通用性,而人工智能的发展可以逐渐在消灭这一前提(想想人类本身对语音内容的识别并不借助特定的预采样,而只需要一个通用的预采样)。

    所以在我看来,语音交互技术在下一代人机接口技术中的表现将不如上述其他两种技术那样成熟,然而由于人类本身的信息交流特征,语音交互将远不只停留在下一代的人机接口技术层面,而可能会延续到下下一代,再下下一代。

     

    事实上,若是说“畅想”(注:任课老师叫俺们写“畅想”),那么我以上所提及的东西都显得太“现实”了。我完全可以畅想到诸如人类意识中的VR(虚拟现实)交互(像电影《Matrix》展现的那样)、畅想到虚体与人体之间完整物理感觉的交互(像你抱着一个在空气中凭空产生出来的枕头,你与枕头周围的力场发生物理感应,从而就像抱着一个真实的枕头一样),甚至干脆就想象电子芯片植入人体或者人类记忆与意识存储在计算机中并以超级人工智能程序方式活动等方式,从而彻底消灭人机交互这门科学(因为人机已经一体)。如果是这样的话,那我还是选择写科幻小说更有意思。

    我是真正地感觉到我们已经站在一个可见的起点上了,这是我去年第一次见到Microsoft Surface的演示时在震撼中获得的一个感受。这个起点显得如此真实,让我已经可以认定二十年后的世界将必定以与现在根本有别的方式来与计算机打交道,无论那时的计算机的物理形式是否还是硅基,人类在今日做出的成果都将成为那个时候的一个影子,而我们已经看到了影子。

    于是我感到我们处在一个多么有希望的时代。我们真正地走在一个迈向下一代的征途上,而我们竭尽自己的创造力与激情,去迎接我们亲手开创的下一代。

     参考文献

    分享到:

    评论

  • 个人觉得,Wii的摇杆和罗技的那个Mc什么的鼠标,只能算是加速度感应,而不能算“肢体感应”……
    而且当新奇感过后,那种正如你说的“很累”的操作,还能吸引多少人……
    顺便一说,好像CeBIT还是哪个大展上展出了套在头上的像是头巾那种柔软而人性化很多的感应器,可以通过意识操纵鼠标……比之前那种用视线操纵的好像方便很多……
    回复HYPER说:
    呵呵所以这就叫吹水,Wii我没玩过,效果到底到什么程度纯粹臆想……可能你说得对,Wii似乎只是做到了加速度感应(我现在所知的Wii演示的游戏似乎就是如此),不过这不要紧,关键是Wii出来后很多人都被吸引了,这个世界上很会投资研发的几个公司都产生了浓厚的兴趣,所以我们只要继续等看好戏即可。
    至于意识操纵鼠标……这个东西如果真的做出来的话绝对是次世代的,只不过我对人类目前对大脑的研究水平还没有那么高的信心。
    2008-05-01 23:08:47