【心理学与AI】【目录】概念学习Concept Learning
领域综述
Concept learning. Wikipedia
Concept learning, also known as category learning, concept attainment, and concept formation, is defined by Bruner, Goodnow, & Austin (1967) as "the search for and listing of attributes that can be used to distinguish exemplars from non exemplars of various categories".
- [1 Rule-based]
按照描述性的规则去分类,“有耳朵,绿色眼睛的是猫” - [2 Prototype]
和一个类别的“原型”(代表这个类的一个模版,比如这个类所有样例的均值)做对比,和哪个原型更像就分为哪一类 - [3 Exemplar]
和类别中的所有样例做对比,“原型”是一种不存在的我们提取出来的抽象表征,而样例是实际见过的,和哪个样例更像就分为哪一类
Exemplar based theories have become more empirically popular over the years with some evidence suggesting that human learners use exemplar based strategies only in early learning, forming prototypes and generalizations later in life. - [4 Multiple-prototype]
多原型的分类模型,一个大类里面可能有很多子类,比如汤勺,可能有大的不锈钢勺,也有小的木勺,比起统一成一个“中号的不锈钢和木头混合勺”,我们更可能保留“大不锈钢勺”和“小木勺”两个原型。多个原型依此推广。 - [5 Explanation-based]
可以看做是rule-based的一个发展版,就是这个描述是随着你学过的样例增多在动态变化的。 - [6 Bayesian]
基于统计的模型,先有个先验的判断,然后根据反馈调整概率分布。简单理解就是边学边调整。
One model that incorporates the Bayesian theory of concept learning is the ACT-R model, developed by John R. Anderson - [7 Component display theory]
学习的过程是由好几个元素共同影响的,每个人可以根据自己的学习风格和内容调整这几个元素的影响程度。
The primary presentation forms include: rules, examples, recall, and practice. Secondary presentation forms include: prerequisites, objectives, helps, mnemonics, and feedback. A complete lesson includes a combination of primary and secondary presentation forms, but the most effective combination varies from learner to learner and also from concept to concept.
Shanks, D. R. (2001). Concept learning and representation: Models.
这篇综述比较早而且出处不详,可以参考里面的理论分类和量化描述。
-
Prototype theories
prototype模型的概率公式
每个类有一个抽象的表征,分类时刺激更靠近哪个表征就被分为哪一类。刺激被分到类的概率是和类之间的相似度,除以和所有分类的相似度之和。每个类的相似度还要乘上对这个类别的选择偏好。这个模型的量化拟合效果并不好。
-
Exemplar models
每个案例都分开存储,对某一类的相似度,以和类内所有example的相似度加权和表示。Nosofsky’s Generalized Context Model (GCM)(Nosofsky 1992)
这个模型表现出来非常高的拟合程度。
Thomas (1998)做了一个分类实验,发现被试能很好的保留example的细节信息,很多关于提取prototype的理论都没法解释这个现象。
他们没解决的问题是没法重复个体差异(Nosofsky et al. 1994),没法解释base-rate effects (Nosofsky et al. 1992)
examplar模型的概率公式 -
Decision-bound/Rule-based Models
根据规则来分类。实验支持,Thomas (1998) 这个实验好像是让判断missing dimension,被试报告的结果似乎可以支持他们形成了一个decision bound(没有实验的具体描述)。但是这个理论的缺陷是,几乎很少有现实中的分类有着非常清晰的bound。 -
Selective Attention in Concept Learning
这个不是一个单独的理论,一般跟以上三个模型是互补的。就是说我们在学习分类的时候,对每个examplar的注意分配并不是一样的,比如Goldstone (1994)就发现如果下一个刺激是同类的,注意就会分配的少,是不同类的就会多。
比如对于examplar模型来说,因为有选择性的注意,所以每个examplar所占的权重肯定是不一样的,这个权重可能可以根据注意资源的分配来估计。 -
Hybird Models
以上几个模型的混合模型也有很多人研究,比如Erickson and Kruschke (1998)混合了examplar和Rule-based,并且描述了这两个成分的权重,是如何随着任务需求动态变化的。他们还综述了一下这种multi-system的其他研究,就是这篇文章有点老了,可能可以顺着找找新的。 -
Time Course of Classification
这个研究角度更像是决策模型,就是关注我们在做分类选择的过程是怎么样的。这个理论对examplar的拓展主要有两派(Lamberts, 2000),一派是认为,一个需要分类的刺激出现之后,脑子里面的examplar就开始竞争,如果被提取出来的examplar相似到足以做判断了,就下结论;另一派是认为,这个决策过程是在逐渐累积信息的(这个过程包括知觉信息逐渐变多,也包括对记忆中的examplar的回忆和修改),哪个类的相似度和先超过阈值,就会判断为这个类。
Goldstone, R. L., Kersten, A., & Carvalho, P. F. (2018). Categorization and concepts. Stevens' Handbook of Experimental Psychology and Cognitive Neuroscience, 3, 1-43.
书里的一章。对概念学习做了比较全面的综述。
- 哪个理论起主导作用,也和学习材料的选取有关。
- rule-based : 材料是遵循简单规则的 (Bruner et al., 1956).
- prototypes : 材料是几个prototypes的简单变形 (Posner & Keele, 1968).
- exemplar : 材料中有很多特例要记 (Nosofsky & Palmeri, 1998; Nosofsky, Palmeri, & McKinley, 1994).
- theories : 材料中有些信息是被试已知的 (Murphy & Kaplan, 2000).
Cohen, H., & Lefebvre, C. (Eds.). (2017). Handbook of categorization in cognitive science (Second Edition). Elsevier.
Chapter 2 - To Cognize is to Categorize: Cognition is Categorization
阅读笔记-Tang Wenwen, Zhu Bihan, Lin Beibei, Zhang Yu, Ye Yizhou
模型综述
Hampton, J. (1993). Prototype models of concept representation.
一本书里的一章。Prototype模型,需要总结一下这个理论框架和对应的行为学证据。大概相当于17页的综述。
阅读笔记-Zhang Yu, Lin Beibei
Nosofsky, R. M. (2011). The generalized context model: An exemplar model of classification. Formal approaches in categorization, 18-39.
也是书里的一章,经典的examplar模型的改进版。
阅读笔记-Zhang Yu
阅读笔记-Wang Zhiyi
模型争论
Murphy, G. L. (2016). Is there an exemplar theory of concepts?. Psychonomic bulletin & review, 23(4), 1035-1042.
作者通过综述说明,现有的现象只能支持,example是发挥作用的,但是并没有任何一种学习只依赖examples。因为纯粹的example模型没法解释1)概念的层级性表征;2)基于特征的概念表征;3)概念的推导和归纳现象
阅读笔记-Lin Beibei
Posner, M. I., & Keele, S. W. (1968). On the genesis of abstract ideas. Journal of experimental psychology, 77(3p1), 353.
最早的一篇支持prototype理论的实证研究。
被试学习一些图片的分类(每个类别都是由一个prototype图片做一些简单变形来的,但是学习序列里不会包含这张prototype图片),然后测试对没见过的item进行分类。
核心发现1 没见过的item有两种,一种是prototype图片本身,另一种是它的其他变形。作者发现对prototype图片本身的分类正确率会明显比其他变形更高。作者认为这说明原型的存在。
核心发现2 有一组被试学习阶段的材料是对prototype的微小变形,而另一组被试的材料变形更大。发现和大变形的组相比,微小变形的组在学习阶段学的更好,但对测试中变异大的item分类不是很好。这说明examplar也是有存储的。
Erickson, M. A., & Kruschke, J. K. (1998). Rules and exemplars in category learning. Journal of Experimental Psychology: General, 127(2), 107.
经典的混合模型,混合了examplar和Rule-based,并且描述了这两个成分的权重,是如何随着任务需求动态变化的。
ALCOVE模型认为,对刺激的多个维度,注意一开始是均匀分配的(感觉实际并不是,但是初始化不一定重要),随着学习的进行,注意力会更多地分配到区分类别的维度上。
而ATRUIM(本文提出的混合模型)假设rule也会产生影响。如果类别样例可以根据某个特征进行分类判断,那么ATRUIM中的rules模块比重就会较高;而如果刺激的正确分类是通过整合样例信息的,那么exemplar模块的比重就会较高。
阅读笔记-第一部分-Tang Wenwen
阅读笔记-第二部分-Ye Yizhou
Nosofsky, R. M., Sanders, C. A., Gerdom, A., Douglas, B. J., & McDaniel, M. A. (2017). On learning natural-science categories that violate the family-resemblance principle. Psychological science, 28(1), 104-114.
真实场景下,类内非常相似的概念学习。和我们一般认为的“抽取类内共性和类间差异”的学习模型不太一样。
阅读笔记-Wang Zhiyi
Lake, B. M., Salakhutdinov, R., & Tenenbaum, J. B. (2015). Human-level concept learning through probabilistic program induction. Science, 350(6266), 1332-1338.
复合的贝叶斯学习模型,作者对学习模型产生的学习结果进行了图灵测试,结果表现出来与人的高相似性。
让机器从一个手写字符的示例中学习,讲笔画拆解成parts再拆解成subpart。机器根据学习得到的结构生成新的字符,人类没法区分出来这是机器生成的还是人写的。
Dubé, C. (2019). Central tendency representation and exemplar matching in visual short-term memory. Memory & cognition, 47(4), 589-602.
在视觉短时记忆中提出了一个新的模型,反驳了GCM,认为在视觉短时记忆中应该考虑prototype的作用。
Vanpaemel, W. (2016). Prototypes, exemplars and the response scaling parameter: A Bayes factor perspective. Journal of Mathematical Psychology, 72, 183-190.
认为贝叶斯因子的视角可以帮助解决原型模型和范例模型之间的争议,重点看一下引言是怎么说原型模型和范例模型之间的争议,以及引用的模型理论。具体贝叶斯因子怎么分析看不懂可以不细看。
阅读笔记-Lin Beibei
Storms, G., De Boeck, P., & Ruts, W. (2000). Prototype and exemplar-based information in natural language categories. Journal of Memory and Language, 42(1), 51-73.
原型模型和范例模型之间的对比,一百多的引量。
阅读笔记-Tang Wenwen
Smith, J. D., & Minda, J. P. (2002). Distinguishing prototype-based and exemplar-based processes in dot-pattern category learning. Journal of Experimental Psychology: Learning, Memory, and Cognition, 28(4), 800.
原型模型和范例模型之间的对比,也是有一百多的引量
阅读笔记-Zhu Bihan
Zubek, J., & Kuncheva, L. (2018). Learning from Exemplars and Prototypes in Machine Learning and Psychology. arXiv preprint arXiv:1806.01130.
主要看一下理论部分。心理学和机器学习中原型和范例的比较。
阅读笔记-Wang Zhiyi
Ashby, F. G., & Valentin, V. V. (2017). Multiple systems of perceptual category learning: Theory and cognitive tests. In Handbook of categorization in cognitive science (pp. 157-188). Elsevier.
多系统理论,这篇综述了COVIS双系统理论,核心思想是基于外显+内隐学习的双通道理论,分析了rule-based和信息整合理论的优缺点,以及对应的实验证据。
阅读笔记-Ye Yizhou