用科学指导设计 ——《认知与设计》读书笔记

2020-11-27 本文已影响0人小蒋不素小蒋

注：此文有大量原文引用，但并无牟利目的，如涉及版权问题，请通知本人下架。另禁止转载。

[格式]

原文摘录

我的批注

第一章我们感知自己的期望

1、影响感知的三因素

过去我们的经验
现在当前的环境
将来我们的目标。

（1）目标的影响

除了视觉，我们的目标还过滤其他感官的感知。一个熟悉的例子是 “鸡尾酒会”效应。如果你在一个拥挤的酒会上与某人谈话，你能把大部分注意力放在他说的话上，即使身边还有许多人在对话。你对谈话的兴趣越大就越能过滤掉周围的对话。如果你对谈话内容感到乏味了多半就会越来越多地听到周围的谈话。

目标对感知的过滤在成年人身上特别可靠，他们比儿童对目标更专注。儿童更容易被刺激驱使，目标较少地过滤他们的感知。这种特点使得他们比成年人更容易分心，但也使得他们观察时更不容易被影响。

第四章阅读不是自然的

1、我们的大脑是为语言而不是为阅读设计的

相反，写作与阅读直到公元前几千年前才出现，而且到了四五百年前才普及起来，远远迟于人脑达到现代进化水平。在孩童时期，我们的大脑没有显示出任何特殊的天生的阅读能力。阅读其实是一种人造的、通过系统的指导和训练获得的能力，就像拉小提琴、玩杂耍或者读乐谱一样（Sousa,2005)。

所以小时候学说话是自然而然的，但是阅读却需要人为指导。

2、阅读是特征驱动还是语境驱动

换句话说，最有效的阅读方式是无语境的、自下而上特征驱动的方式，这需要熟练掌握到无意识的程度。尽管与特征阅读是两个并行的阅读方式，但语境驱动阅读在如今主要被视为种候补的方法，只有在特征驱动阅读存在困难或者不能达到足够无意识的时候才起作用。

为什么无语境（自下而上）的阅读在某些成年人中无法无意识呢？有些人在儿童期没能获得足够的阅读经验，让特征驱动的识别过程变成无意识的，他们长大后就觉得阅读在精神上是费劲和压力重重的，因此也就避免阅读，这持续加剧了他们在阅读能力上的不足。

所以还是得从小练习，使之变成特征驱动。

3、糟糕的信息设计会影响阅读

（1）不常见和不熟悉的词汇

例如：“你的会话己经过期。请重新认证。”。大部分非技术用户并不理解“重新认证”的意思，于是就退出无意识阅读状态。

（2）难以辨认的书写和字型

略。

第五章色觉是有限的

1、色觉是如何工作的

（1）视杄细胞和视椎细胞

如果你在学校上过心理学或者神经生理学的课程，或许你已经知道了眼睛内的视网膜（也就是眼球里聚焦成像的表面）有两类感光细胞：视杄细胞和视椎细胞。你或许也了解了视杆细胞察觉光线强度但感觉不到颜色，而视椎细胞能察觉颜色。最后，你或许还知道有三类视椎细胞，分别对红色、绿色和蓝色光敏感，这意味着我们的色觉与摄影机和计算机显示器类似，通过红色、绿色和蓝色像素的组合来探测形成多种颜色。

首先，处于工业化社会中的我们几乎用不到视杆细胞，它们只在低亮度下工作。在光线很暗的环境中，如 19 世纪前我们祖先所生活的环境中，它们才起作用。今天，我们只有在烛光晚餐、夜里在黑暗屋子周围摸索、夜晚在外宿营等情况下才用到视杆细胞。在明亮的白天和人工照明环境（我们在此打发的时间最多）下，视杆细胞则完全过曝了，不能提供任何有用信息。大部分时间里，我们的视觉完全基于视椎细胞所提供的信息。

（下面单独介绍）视椎细胞：

低频这些视椎细胞对整个可见光频谱都敏感，但对处于频谱中间的黄色和低频的红色最敏感。
中频这些视椎细胞对从高频的蓝色到中频偏低的黄色和橙色有反应，但在整体上，它们的敏感度低于低频的视椎细胞。
高频这些视椎细胞对可见光的高频部分（紫色和蓝色）最敏感，但对中频（如绿色）的敏感度较低。此类视椎细胞的整体敏感度较前两者都低，数量上也更少。因此，我们的眼睛对蓝色和紫色不如对其他颜色敏感。

如下图所示：

所以并不是我们想象中那么均匀分布。

2、视觉是为边缘反差而不是为亮度优化的

我们的视觉是为检测反差（边缘）优化的，而不是绝对亮度。

对对比度敏感而不是对绝对亮度敏感是人类的一个优势，这样我们原始社会的祖先无论是在阳光普照的午，还是在阴云密布的清晨，都能分出躲在附近灌木从中的豹以及其他类似的危险动物。

同样，对颜色对比度而不是对绝对色彩敏感，会让我们觉得阳光下和阴影里的玫瑰花都一样红。

第六章我们的边界视力很糟糕

1、中央凹的分辨率与边界视野的分辨率比较

中央凹仅占视网膜面积的 1%（将你的手臂伸直并着你的大拇指。你的拇指指甲盖，从一只手臂之外看去，大约与中央凹的大小相当），而大脑的视觉皮层却有 50% 的区域用于接受中央凹的输入。进步说，中央凹的视椎细胞与视觉信息处理和传导的起点一神经节细胞的连接比是 1:1, 而在视网膜其余地方，多个光感受细胞（视椎细胞和视杆细胞）才与一个神经节细胞相连。

正常人的中央凹的分辨率非常高：他们能在那个区域里分出好几千个点，比现在许多口袋数码相机更高。而我们的边界视觉分辨率如此之差。

那么一定有人要问为什么我们看到的世界不是一个隧道”，即除了直接注视的东西，其他所有东西都是失焦的。相反，我们看周围的东西也都是清晰的。我们能有这样的感觉是因为眼睛以大约每秒三次的速度不断快速移动，选择性地将焦点投射在周围的环境物体上。大脑则用粗旷的、印象派的方式，基于我们所知和所期待的，填充视野的其他部分。大脑无需为我们四周的环境保持一个高分辨率的心理模型，因为它能够命令眼睛在需要的时候去采样和重新采样具体细节。

2、边界视觉有什么用

边界视觉的存在主要是为了提供低分辨率的线索，以引导眼球运动，使得中央能够看到视野里所有有趣和重要的东西，或者察觉运动。

3、盲区

关于我们视野的另一个有趣的事实是它有一个缺口，一个我们什么也看不到的小区域。这个缺口对应于视网膜上视觉神经和血管在眼球后的出口。那里没有视杆细胞和视椎细胞，因此我们视野中的某个物体的成像如果恰好落在这个缺口上，我们就看不到它。我们通常注意不到它是因为大脑用其四周的景象填补了它。

4、阅读需要大量的眼球运动

视野的其他部分不能用于阅读。这真正意味的是从中央凹开始的神经网络，从视觉神经到视觉皮层，并扩展到大脑其他部位，被训练成能够阅读，但从视网膜其他区域开始的神经网络无法用于阅读。我们读到的所有文字是被这个中央区域扫描过才进入视觉系统的。这意味着阅读要求大量的眼球运动。

第七章我们的注意力有限，记忆力也不完美

1、短期记忆

短期记忆不是存储一一它不是记忆和感党被处理的地方。更准确地说，它不是感觉系统获得的信息或者从长期记忆中取出的信息的临时存放处。短期记忆是感觉和注意现象的组合。

”短期记忆“这一点跟我之前看的《为什么学生不喜欢上学》里关于“短期记忆”的介绍恰恰相反。

（1）特点

低容量
高度不稳定性

（2）长期记忆的特点对用户界面设计的影响：模式

1、介绍

例如：在许多数码相机里，按下快门可以是拍照片或者拍摄视频录像，这取决于当前选择了哪个拍摄模式。

2、优缺点

带模式的用户界面有其优势，这是为什么很多交互系统提供模式。模式允许一个设备具有比控件还多的功能：同样的控件在不同模式下提供不同的功能。模式让交互式系统分配不同的意义给同样的操作从而减少用户必须学习的操作的数量。

然而，模式有一个为人熟知的缺点，就是人们经常犯模式错误：他们会忘记系统当前所处的模式而导致误操作。尤其是在对当前处于哪个模式提供糟糕的反馈的系统中，这个缺点尤其明显。因为模式错误的问题，很多用户界面设计准则说要么避免模式，要么提供强烈的反馈告知当前所在的模式。人类短期记忆太不可靠，以致设计者不能假设用户在没有清晰、连续的反馈时，能够记住当前系统处于何种模式，即使系统的模式切换是由用户决定的。

2、长期记忆

虽然 Landauer (1986) 使用人的平均学习速度来计算一个人一生能够学习到的信息量，但还没有人测量过或者预测过人脑的最大信息存储量。

（1）缺点

容易出错
印象派
受情绪影响
追忆时可改变，即可回溯修改
……

（2）长期记忆的特点对用户界面设计的影响

长期记忆特点的主要启示在于，人们需要工具去加强它。从史前时期开始，人们发明了各种帮助自己长期记住事物的技术：刻了槽的木棍、打了结的绳索、记忆术、口述的故事和炉边口耳相传的历史、文字、经卷、书本、数字系统、购物单、检査表、电话本、日记本、记账本烤箱计时器、计算机、移动数字助手（PDA）、在线共享日历等。

第九章识别容易，回忆很难

1、识别容易，回忆很难

经过上百万年的进化，人脑已经被“设计”得能够很快地识别出物体。相反，在没有感觉的支持下找回记忆，对生存来说一定是不重要的，因为我们的大脑一点也不善于回忆。

2、识别与回忆对用户界面设计的影响

看到和选择比回忆和输入要容易对用户显示可选项并让他们从中选择，而不是强迫用户回忆出他们的选项再告诉电脑。

例子：

这个规则是 GUI 能够在个人电脑中几乎完全替代命令行用户界面（CLI）的原因。
尽可能使用图像来表达功能。
不需要用户回忆认证数据的认证方式看起来是个解决办法。比如生物识别的认证方式，

第十章从经验中学习与学后付诸实践容易，解决问题和计算很难

1、我们有三个大脑

旧脑主要是脑干，即脊髓进入大脑底部的地方。随着第一条鱼进化出来，脑干就出现了（鱼类出现之前的昆虫和软体动物没有通常意义上的大脑）。旧脑将所有东西分成三类：可以吃的、危险的以及性感的。它也负责调节身体的自动功能，例如消化、呼吸和反射活动。爬行动物、两栖动物和大部分的鱼类只有旧脑。
中脑大脑的这部分被称作“中脑”有两重意思：(a）物理上，它居于旧脑之上和大脑皮层之下：(b）在进化的顺序上，它在旧脑之后和新脑之前。中脑控制着情绪，对事物产生愉悦、难过、害怕、竞争意识、忧虑和愤怒等。鸟类和低等哺乳动物只有旧脑和中脑。
新脑这部分主要由大脑皮层组成。它控制着有目的、有意识的活动，包括制作计划等。大部分的哺乳动物在旧脑和中脑之外还有新脑，但只有小部分高度进化的哺乳动物如大象、海豚、鲸以及猴子、猿人和人类才拥有相当大的新脑。

2、旧脑和中脑的作用

（1）从经验中学习

1、介绍

从经验中学习的能力有着漫长的进化史。要做到这点，一个生物并不需要有大脑皮层（即新脑）。旧脑和中脑就能从经验中学习。即使是昆虫、软体动物和蠕虫，连旧脑都没有，仅靠几个神经元簇就能从经验中学习。然而，只有拥有了大脑皮层或者具备类似功能的大脑的生物才能够从其他生物的经验中学习。要想意识到自己是从经验中学习，大脑皮层就肯定是必需的。

2、缺陷

然而，我们从经验中学习的能力并不完美，这有几个原因：

第一，对复杂的情况，比如那些涉及了很多可变因素或者受许多难以预料的外界因素影响的情况，人们很难做出预测，或者从中学习并概括。例如：

有经验的股票投资者仍然不确定现在该买或卖掉哪些股票
在丹佛市生活多年的人们仍然无法预计那儿的天气变化
虽然在不同场合下你与你妹妹的男朋友沟通过几次，但你还不能确定他到底是不是个好

第二，从自己生活中或者亲人好友们那里获得的经验要比那些读到的或者听到的经验对我们更有影响力。例如，我们可能读到或者听过报道、消费者的评价以及统计数据指出丰田 Prius 是一款好车，但如果姐姐或者叔叔曾经有过关于它的不好的经验，我们对这种车或许就有了负面的评价。我们这么做是因为我们的中脑认为家庭成员与自己更相似，也就比其他成千上百不知名的消费者更可信，虽然从理性的角度看，统计数据要可靠得多。

第三，当人们犯了错后，并不总能学到正确的教训。当发现自己处于一个糟糕的处境时，他们并不能很好地记起最近的行为从而将自己当前的处境与真正的原因联系起来。

第四，人们从经验中学习的第四个问题是他们经常过度概括，即片面地总结。例如，许多人因为见过的乌鸦都是黑的就想当然地认为乌鸦都是黑的。实际上存在不是黑色的乌鸦。

3、新脑的作用

（1）解决问题和计算

1、解决问题

拥有大脑皮层能够让生物脱离对本能的、被动反应的、无意识的和熟练行为的完全依赖。大脑皮层是有意识地进行推理的地方（Monti, Osheron, Martinez, & Parsons,2007)。

不过解决技术问题需要对技术感兴趣并经受训练。

2、计算

现代人是从 20 万 50 万年前的原始人类进化来的，但直到公元前 3400 年左右，人们才在美索不达米亚（现今的伊拉克）发明了数字与数值计算，并开始在交易中使用。那时候，人类大脑基本与今天人类的大脑一样了。既然人类大脑在数值计算出现之前就已完成进化，也就不可能是为计算而优化的了。

3、解决问题和计算都需要短期记忆的帮助

相对地，受控的处理，包括解决问题与计算，需要专注的注意力和不间断的有意识地监控，并且相对较慢和顺序地进行（Schneider& Shiffrin,1977)。这就拉紧了我们短期记忆的限制，因为执行指定步骤所需的所有信息块为了争夺稀少的注意力资源而相互竟争。这就要求有意识的心智上的努力，就如你被要求从 M 到 A 倒序背通字母表。

（2）充当了沖动行为的刹车器

略

4、在用户界面设计上的影响

让用户使用感觉（经验）而不是计算。

第十一章许多因素影响学习

1、当操作专注于任务、简单和一致时，我们学得更快

认知心理学家把用户想要的工具和工具所能提供的操作之间的差距称为“执行的鸿沟（Norman& Draper,1986)。使用工具的人必须耗用认知力量将他想要做的转换成该工具能够提供的操作，反之亦然。这种认知努力将人的注意力从任务上拽走，放到了对工具的要求上。个工具提供的操作与用户想要做的之间的鸿沟越小，用户就越不需要去考虑工具本身，而能更专注于他们的任务。因此，这个工具也就能更快地自动化了。

最高的境界看来就是ai直接读取人的大脑的想法，然后去执行。

2、概念模型

（1）对象一操作矩阵

构造对象一操作矩阵能够为你在视觉上展示出交互系统概念模型的复杂度。矩阵越大，就意味着越多概念需要学习。

（2）有一个好的概念模型能够方便开发一套专注于任务、熟悉和一致的专用词汇

软件开发团队应从概念模型中创造一个产品词典。在这个词典里，该产品（包括它的文档）中用户能接触到的每个对象、动作和属性都有一个名字和定义。词条和概念在词典中应一一对应，而不该出现多个词汇对应到一个概念或者一个词汇对应多个概念的情况。

第十二章我们有时间要求

1、响应度 vs 有效性

感知的响应度可能看起来不如有效性重要，但实际上相反。

但高响应度的交互系统并不一定是高性能的。

2、时间感知

（1）理论

我们的听觉比视觉更敏感。我们的耳朵使用机械的声音传感器，而不是电化学神经电路。

（2）时间常数的工程近似法：数量级

我们只考虑到 10 倍的级别。类似地，我们可以得到 10ms 左右、100ms、1s、10s 和 100s 级的分组。100s 以上就超过了大多数交互设计者需要考虑的范围。

具体参考如下图。

3、在用户界面设计上的影响

（1）使用忙碌标识

不使用忙碌标识的常见的借口是操作很快就会结束，因此不需要显示忙碌标识。但多快才是“快”？万一操作不是每次都很快执行完呢？如果用户的电脑比开发者的电脑慢很多或者没有优化呢？如果操作要读取的数据一时被锁住了呢？再如果操作需要访问网络服务而网络此时拥堵或者断线了呢？

软件应为任何在运行时会阻止用户继续下一步的操作显示一个忙碌标识，即使这个操作通常能够很快执行完（比如在 0.1s 内）。万一操作堵塞或者死机，这个标识对用户可能是非常有用。

动态的等待标识比静态的对用户更友好，因为它们显示系统正在工作，而不是崩溃或者挂起以等待网络连接或数据解锁。当然，忙碌的动态标识应与其代表的实际的计算相同步。

（2）使用用户进度指示

显示一个操作已经完成了的百分比时，从 1%开始，而不是 0%。

进度的显示应是平缓的、线性的而不是不稳定爆发式的。