导航设计框架的可用性测试

对于一个已上线的网站,远程测试(remote testing)也是可以的。这种方法中,参与测试者使用他们自己的电脑,就和他们正常浏览网站一样。使用软件跟踪他们点击了哪里以及如何导航,参与者甚至可以通过文本输入框,为每个页面提出反馈。远程可用性测试是一种针对地理位置分散的用户群体的好方法。

    可用性测试的组织通常与基于实验室的试验类似,参与者执行一些能代表他们可能会与网站如何交互的任务。完成任务的同时,他们被要求“有声思考”,描述他们的所见所感。你的工作是在他们导航时观察、聆听并做笔记。然后确定用户遇到困难的部分,再提出改善的建议。

可用性度量的价值

我们认为可用性度量是非常有用的。测量用户体验所能提供的信息要远远多于简单的观察所能提供的信息。度量使设计和评价过程增添了结构化的元素,能够给予调查的结果以更好的理解,同时给决策者也提供了重要的信息。如果缺少可用性度量所提供的信息,决策者可能就要根据不正确的假设,直觉或预感做出重要的商业决策。因而,这种情况下的有些决策不是最好的决策。

    在典型的可用性评估中,很容易发现很明显的可用性问题。但是很难估计这类问题的数量。比如,如果一项研究中的所有8名参与者都碰到了同样的一个问题,那你可以十分确信这确实是一个很常见的问题。但这8名参与者中只有2名或3名碰到了这个问题呢?对于比较大的用户群来说这意味着什么呢?可用性度量有办法估计可能碰到这个可用性问题的用户数量。要知道可用性问题的大小可能意味着要面临这样一种差别;推迟某个重点产品的发布,或者为一个优先级较低的错误增加一个额外的组件。没有可用性度量,可用性问题的多少只能靠猜测。

什么是可用性问题

可用性问题是什么?对此并没有一个简单的定义,所以说明什么是可用性问题的最佳方式就是给出一些例子:
 
        1)任何影响了任务完成的情形。
 
        2)任何导致用户“偏离航线”的情形。
 
        3)任何让用户产生某种疑惑的情形。
 
        4)任何导致错误的情形。
 
        5)没有看到应当注意的内容。
 
        6)认为本来错误的内容是正确的。
 
        7)任务未结束时以为已经完成了。
 
        8)错误的操作行为。
 
        9)对内容的误解。
 
        10)不理解导航。
 
       在确定可用性问题时需要考虑的一个关键问题是可用性问题的用途是什么。发现可用性问题最常见的使用情况是迭代式设计流程中帮助改进产品。在这种情况下,最有用的可用性问题应当指出如何对产品进行改进。换句话说,只有可执行的问题才会有帮助。即便他们在没有直接指出是界面的哪一部分出现了可用性问题,也应当说明应当去哪里找。
 
       当然,不是所有的可用性问题都是应当避开的。有些可用性问题是正面的,比如产品的某些设计在易用性、效率或满意度方面超出了用户的期望。有时会称这些问题为可用性“发现”,因为问题一词通常都会引起负面的联想。下面就是一些证正面发现的例子:
 
       帮助用户明确且尽可能高效地完成一项复杂交易。
 
       操作流程中的每一步都预测到了用户的需求。
 
       在不知不觉中对用户进行了使用培训。
 
       采用一种清晰简单且容易为用户理解的方式来表达复杂的信息。
 
       报告这些积极发现的主要原因除了为项目团队提供积极的反馈外,还可以确保在以后的设计迭代中不会“背弃”这些正面的界面设计

形成式可用性

当进行一个形成式可用性研究时,可用性专家很像一个厨师,在菜肴的准备过程中定期检查并作出对最终结果有积极影响的调整。厨师可以加一点盐,然后多放一点香料,最后在上桌前加少量的辣胡椒。厨师定期评估、调整,然后再次评价。而形成式可用性研究与此如出一辙。可用性专家就像厨师一样,要定期评估一个产品或设计,发现其中的缺点、提供修改建议,然后重复此评估、修改的过程,在理想的情况下直至最终完成的产品尽可能接近完美的方案。

    形成式可用性区别于其他类型可用性研究的是其迭代式测试。其目标是对设计进行改进,即发现或分析问题、提出修改建议,然后待完成修改后再次评估。形成式可用性总是在设计最终确定之前进行。事实上,越早进行形成式可用性评估,可用性评估对设计的影响就越大。

可用性数据的噪音太多

对于可用性度量的猛烈批评之一是认为度量数据的“噪音”太多:太多的变量对获得所发生事情的清晰原貌造成了阻碍。“噪音”数据的经典例子是:在一个自动化的可用性研究中,当测试参加者出去喝咖啡或者回家过周末时,还在继续测量任务完成时间。尽管这种情况是偶然的,但这不应该妨碍你收集任务完成时间的数据或其他类型的可用性数据。有一些简单可行的办法可以用来减小甚至剔除数据中的噪音。可用性数据可以被整理,这样在分析中就不会用到极端的数值。定义完备的流程可以用来确保在评估任务或可用性问题时保持恰当的一致水平。很多标准的可用性问卷已经被不少研究人员给予了广泛地验证。所以基本情况是:如果给予一些周全的考虑和几个简单的方法,可用性数据中的众多噪音都可以被显著地被减少,直到显示用户行为和态度的清晰原貌。

当集中在细小改进上时,可用性度量是没有用的

当只对一些相当细微的改进感兴趣时,项目团队中的有些成员就会置疑度量是否有用。他们会说最好的做法是集中关注一类有限的小改进,而不是担心可用性度量。他们可能也没有任何额外的时间或预算去收集任何的可用性度量。他们还会说在快速迭代设计过程中,度量没有自身的位置。但是分析可用性问题是一个显而易见且颇有价值的解决方案。例如,关注可用性问题的严重程度和频率及其出现的原因是在设计过程中可以集中资源的极好途径,这种方法可以同时节省项目的经费和时间。以往有些研究可以帮助你回答关键性的可用性问题。在此基础之上,你可以容易地就能获得一些可用性度量。不论项目大小,可用性度量都是同样有用的。

可用性研究的评估方法

收集可用性度量最为显著的特点之一,就是你不必拘泥于某一种特定类型的评估方法(比如,实验室测试、在线测试)。可用性度量可以通过使用几乎任何一种评价方法来获得。这也许很让人惊讶,因为通常有一种误解是可用性度量只能通过大规模的在线研究获得。如你所见,其实不是这样的。

    选择一种测试方法来获取可用性度量,最终取决于需要多少个参加者和采用什么样的度量。最常用的可用性方法是实验室测试,这需要相对较小的样本量。实验室测试是一种一对一的形式,即一个测试人员与一个参加者。测试人员对参加者提问,让参加者在问题产品上完成一系列既定任务。参加者通常在完成这些任务过程中进行出声思维。测试人员记录参加者的行为和对问题的反馈。实验室测试在形成式研究中使用最适合,因为形成式研究的目标是进行迭代式的设计改进。所要收集的最重要度量是关于可用性问题的,包括问题发生频次、类型和严重性。而且,采集诸如任务成功、错误和效率等绩效数据页会有帮助。

设计人员的克制态度是如何减轻可用性问题

随着Web设计人员经验的增加以及采取更为克制的态度,我们看到13个可用性问题逐渐地得到了改进。这些问题仍然会带来潜在的危害,因为未曾看到他们早期的网站是如何失败的那些缺乏经验的设计人员可能会受到诱惑面重新使甩它,不过经验丰富的设计人员会知道在什么时候以及如何使用技术来创建好的用户体验。

*插件和最新的技术
*三维用户界面
*浮华的设计
*启动画面(splash page )
*移动的图形和滚动的文字 _自制的图形用户界面控件(GUI widgets )
*没有说明信息是由哪里提供的 _自造的单词
*过时的内容
*网站内部的不一致性
*过早地要求用户提供个人信息
*多重网站孤立页面