译文 | 如何毫不费力地将可用性测试数据用于实践
原文作者:CARLOS ROSEMBERG
译者:阿呜GXR
原文地址:https://uxplanet.org/turning-usability-testing-data-into-action-without-going-insane-9f364a683076
收集、分类以及理解数据已经渐渐成为用户研究和可用性测试中用户体验从业者的一项常见任务——事实上,它已经成为一项具有决定性的用户体验工作技能。一项可用性测试可以告诉你,为什么你的目标用户会使用你的产品。它将帮助你辨别出用户遇到的问题,例如特殊的用户界面、暴露出的难以完成的任务以及令人费解的表达。通常一项可用性测试包含大量的准备和分析,它被认为是最具价值的研究方法。它能够同时提供定量和定性的数据,这将帮助和引导产品团队找到更好的解决办法。
但是,这项工作并不是像公园中散步那么简单。为了去发现用户体验中的问题,用户体验研究员和设计师常常需要处理大量不完整的、不准确的以及令人费解的数据。通常一个由5-10人参与的可用性测试可以比较容易的发现6个以上的问题。
最大的风险是当你尝试着去解决问题时却走错了方向,这样将无法真正解决当前的问题。这种风险有可能是已发现的问题和得出的解决方案之间并没有什么联系。有很多不同的因素会造成这样的现象,包括决策疲劳和认知偏见。
怎样将可用性测试中的数据转化为切实可行的解决方案
为了剔除前文所提到的干扰性因素,我们需要有效的方法来处理我们的测试数据,以确保我们针对已发现的问题选择出最有效的解决方案。
让我们借用一些创意过程中使用的方法。其中一个最具权威性的是英国设计委员会提出的双钻石模型,依次使用发散-收敛的思路。它是一种有清晰定义、完整问题及解决方案的设计过程。
清楚地分为四个阶段——发现问题、定义问题、构思方案、交付方案——双钻模型是一个简单的设计方法的视觉图。(英国设计委员会,2005)双钻模型是我们处理可用性问题并找出解决方法时需要建立的一个框架。
使用这个模型来得到可用性测试结果的过程分为四步:
1.数据收集
2.划分问题优先级
3.产生解决方案
4.划分解决方案的优先级
让我们看看实践中每一步的细节。
备注:我们需要运用到一些基础的数学。不过不用担心不会用到太多,在本文的最后你还可以看到一个自动化的电子表格来展示全过程。如果这对你仍然没有帮助,你还可以使用便利贴和白板等视觉化的方法。
第一步:可用性研究数据的收集
从你要研究的问题开始,第一步就是收集可用性测试产生的数据。数据的准备是为了在之后的过程中更容易地产生想法和见解——最重要的是清晰的数据结构和组织来避免混乱。在大多数案例中它需要满足:
·有一个问题识别系统
·标注出问题发生在哪里(屏幕、模块、用户界面组件、流程等等)
·了解用户正在参与的任务
·提供一个简洁的问题描述
在《量化用户体验》这本书中Lewis和Sauro使用了一种通用的可用性问题组织方法绘制出下方的表格,在每行中写下可用性问题,在最后一列写出参与者。
上方的例子是一个虚构的可用性测试,有三名参与者并且发现了两个可用性问题:
第一个问题由参与者一号P1发现
第二个问题由其他参与者P2和P3发现
第二步:问题优先级
由于资源是有限的,所以很有必要使用一种方法来安排可用性问题的优先级以帮助优化分析。通常每一个可用性测试问题都有严重性评分,它受诸如以下一些的因素影响:
· 任务的关键性:若无法完成任务,则该评估问题将对商业和用户产生的影响
· 问题发生频率:同一个问题在不同参与者测试过程中的发生次数
· 问题的影响:对于用户顺利完成任务产生多重要的影响
为了分出优先级,我们需要以下几个步骤:
1.给测试中的每个任务设立关键性评分。简单来说,根据该任务对于商业或用户有多重要来给他们设置一个分值。分值可以是一个简单的线性数列(例如1、2、3、4等等)也可以是一些更复杂的(例如菲波那切数列1、2、3、5、8等等),就像敏捷团队使用计划扑克这种方法。
2.在这个衡量标准下给每一个问题设立影响力分值(与上述一致)
5分:(阻碍)这个问题阻碍了用户完成任务;3分:(主要的)它会产生失败或延期;2分:(较小的)对于完成任务的行为表现产生较小的影响;1分:(建议)参与者提出的建议
3.通过问题出现次数除以参与人数来计算问题出现频率,这是一个基础的百分比计算。
4.最终,将前文提到的三个变量相乘,来计算每个问题的严重性。
让我们看看在电子表格中它应该如何运行(当然我们希望有一个全自动化的表格,对吗?)我们升级的表格看起来将会像这样:
在上文的例子中,我们有得出下场景:
·三个参与者体验了三个可用性测试的用例(P1、P2和P3);
·创建一个帖子这个任务出现了两次并且严重性分值为5,不太严重的任务社交登录的严重性分值为3;
·每一个问题都按照它产生的影响分配分值:5(阻碍)、3(主要的)以及2(在任务进行中产生较小影响)
·每个问题的发生频率(例如第二个问题在三个参与者的参与过程中出现了两次,因此2/3=0.67);
·最终,严重性结果根据其他的几个因素相乘得来(例如3x5x0.33=4.95)
现在我们发现可用性问题的重要性优先级排列应该是:3、2、1。在这个阶段我们对于这些可用性问题的解决也有很多好的想法法——这张表格将帮助整个团队列举优先级高的问题并按照以下步骤进行优化。
第三步:解决方案的产生
通常来讲,当没有列举出通用的修改建议和具体的解决方法时,可用性测试的总结并不算完整。有时解决方案非常的明显——例如修正用户界面上某个组件的位置。当问题没那么明显或有很多解决方案时情况就变得复杂起来。哪一种解决方法更好?哪一种更加可行?做一个实验来查明需要付出或可以得到的收益是什么?在这里,传统的解决方法将不起作用。
为了降低做出错误设计决定的风险,我们需要:a)有一些备选的解决方案。 b)有效的选取过程。我们将使用在前期数据收集和优先级排列的过程中运用过的离散-聚合方法。步骤如下:
1.对于每个问题,需要准备大量的解决方案
什么是最有可能来解决问题的方法?这里,我们有很多的机会来和团队中其他成员进行合作(开发人员、设计师、产品管理者等等)。
2.重组解决方案,让解决方案更加详细
必须合并或分离解决方案来避免过多或抽象的概念。再重申一次,更加详细的解决方法可以让评估更容易。最好使用更加详细的描述,例如“使用水平导航和垂直的树形菜单”来替代“避免使用汉堡菜单”这样的描述要更好一些。
3.解决方案可以解决额外的问题
在实践中,一个好的解决方案可以处理大量的问题。好的解决方案是通用的。
根据以下步骤,统计结果的表格应该像这样:
在这个例子中,经过头脑风暴后我们在每一行列出了解决方案,在每一列写下之前步骤中发现的问题所对应的解决方案。
然后,让我们看看如何优化这份表格,找出每个问题对应的最优解决方案以及对应的顺序。
第四步:解决方案的优先级
类似于问题的优先级,我们需要按照一些参数来排列解决方案的优先级。在敏捷团队中对待这类问题非常严谨,他们通常使用商业价值和复杂性来计算投资回报率(ROI)。借用逻辑学方法,我们使用以下步骤:
1.计算出每个解决方案的效力
更严谨的处理问题才能得到更好的结果。这大概与敏捷方法中计算商业价值差不多。将所有问题的解决方案重要性相加。
效力=问题重要性之和
2.简化解决方案的复杂度
进一步发展这个解决方案需要什么样的资源?技术标准如何?怎样明确商业或用户的需求?换句话说,付出越多的努力和越多的不确定性,就会使解决方案越复杂。把这些转化成像菲波那切数列(1、2、3、5、8等)那样可以计量的数值。如果您正在做这些,计划扑克将非常适合您的团队。计算解决方案的投资回报率——付出与收益之间的关系,越高的投资回报率越好。
投资回报率=效力/复杂程度
让我们回到电子表格,它现在看起来应该如此:
从上面的例子中我们看到:
1.列表的每一行为解决方案
2.问题1到3的严重性分别为4.95、6.7和10.05
3.这个解决方案每对应解决一个问题就标记一个1
4.每个解决方案的效力分别为4.95、4.95和16.75
5.由团队来评估每个解决方案的复杂性1、3和5
6.每个解决方案的投资回报率为4.95、1.65、3.35
从这个例子中,我们应该根据下面的表格来确定解决方案付诸开发的优先级(从高到低排列投资回报率):解决方案1、然后是解决方案3最后是解决方案2。
总结一下步骤:我们从收集数据开始,根据严重性分值把问题划分优先级。然后,我们产生一些针对这些问题的解决方案,最终,给它们划分优先级。
使用电子表格
上面提到的方法包括了很多基础的计算方式,重复使用了很多次,所以最好使用电子表格。如果你想要使用这种方法,这里是谷歌表格的模板:https://goo.gl/RR4hEd.它是可以下载的,并且你可以自由定制你需要的表格。
我不喜欢电子表格!是否可以有一些视觉化的方法?
几乎我所知道的每一个人(当然包括我自己)都喜欢使用便利贴和白板来工作,不仅仅是因为这个方法更加快捷和有趣,还因为它有助于合作。如果你们是敏捷或设计思维的从业者,你就会理解我所说的意思。我们要提供一种怎样的视觉化工具(例如便利贴)来使用文章中的方法呢?这可能需要发表一篇博客来说明,那么我们就先从表面层次上讲一下。
一个方法是建立一个问题坐标(影响 x 频率)然后建立一个解决方案的坐标(效力 x 复杂性)。每一个坐标被分为四个象限并表明优先级。
问题坐标及解决方案坐标
步骤如下:
1.根据影响力和频率将便利贴贴在合适的象限。为了简化这个方法,我们需要在这个案例中省去问题的关键性这个参数。
2.根据每一个解决方案的效力和复杂程度来组织便利贴,创建一个解决方案的坐标。
3.头脑风暴每个问题的解决方案,从第一象限中的问题开始(有更高重要性的问题)。
4.从左上方第一象限开始将这些解决方法放在解决方案的坐标里,越严重的问题,它的解决方案就越有效。
5.在横坐标轴上移动调节每个问题的复杂性(越复杂越有可能接近正确)
6.重复这个方法来处理剩下的问题(坐标中的第二、三、四象限)
在练习的最后,在第一象限中的就是投资回报率最高的(更有效且不复杂的解决方案),代表最高优先级。结果在下图中展示:
事实上我们省略了一个指标(任务的关键性),因此你不得不依赖精确地目测来代替电子表格的精准计算。积极地一面是我们有一种方法来促进合作——有时得到团队的支持才是关键。
使用这种暂且应急的视觉分析方法可以促进团队协作,但也会降低数据的准确性。哪一种是更好的方法?最简单的回答是:最适合你当前情况和最符合你目标的方法就是最好的。
可用性测试数据分析的最终启发
在不同团队项目中我们提出了以下结论:
1.尤其是在处理比较大量的研究工作时,问题的优先级可以让团队专注在真正重要的事情上,节约时间和资源来减少不必要的认知挑战,比如信息过载或无力分析以及决策疲劳;
2.工作流程首尾相连可以让解决方案和可用性测试的输出更加匹配(因为问题和解决方案应该是相匹配的),降低使用不太理想的解决方案的风险。
3.我们可以使用在线工具非常容易地应用这种方法来合作(使用一部分或全部)
非常重要的一点是需要了解这个方法的局限性。例如,在优先级阶段我们只关注了可用性问题,积极地态度和行为在测试中并未包括进来。有一个建议就是可以分开记录这类数据,使用它来补充和平衡测试结果。
抛开可用性测试,这个方法中的技能也可以应用到其它用户体验研究中。我们可以在其它项目中使用双钻模型(分散/聚集问题和解决方案)的方法来分析用户研究数据。
你的想象力才是局限!
译者注:
计划扑克(planning poker):
是一个促使达成团队一致意见的团队构建活动。用于评估一定的工作量需要花费多长时间完成。在计划扑克(Planning Poker)开始前,引导人将开发团队聚在一桌并给每个成员分发一副专用牌,这也是扑克这个名字的来由。引导人和负责人没有牌。
每张牌有一个数字,这个数字相当于完成特定工作量所需的天数。举例来说,这副牌中的最小数是1/2(半天),而数值最高的牌写着21(一个月)。中间的牌通常用斐波纳契数列(1, 2, 3, 5, 8, 13)标数。每副牌都有一张卡片代表该工作需要花费过多的时间来完成。
团队评估构建时间时,每个开发人员从他的那副牌中选择一张来对应他认为完成该工作所需的天数,并将这张牌背面朝下放在桌上。一旦最后一张牌放下,引导人将牌翻面。如果每张牌一样就达成了一致意见,那么引导人就继续下一个用户事件的时间评估。但更可能的是,一些人的牌上数字和其他人不一样。这种情况下,引导人的工作就是适当进行商讨并邀请给出高值牌和低值牌的开发人员解释他们的原因。直到团队达成一致意见或者引导人判决无法达成一致意见,该事件必须在项目开始前分解成更简单的任务后再次进行评估。