生活中的统计学

2020-12-14  本文已影响0人  小红帽来了

办公室里两位语文老师在讨论红学,刚好说到了《红楼梦》后四十回的争议问题,刚好之前看到一篇相关的文章,我也加入了闲聊。

1985年,复旦大学李贤平教授带领他的学生做了这样一个调查。将书中120回看成是120个样本,确定与情节无关的虚词出现的次数作为变量,巧妙运用数理统计分析的方法,分析哪些回出自同一人的手笔。

一般情况下,同一情节大家描述得都差不多,但由于个人写作特点和习惯不同,所用虚词是不会一样的。利用多元分析中的聚类分析法进行聚类,果然将120回分成两类,印证了之前的结论。

之后还进一步分析了前80回是否为曹雪芹所写?根据曹雪芹的其他著作,做了类似计算,证实用词手法完全相同,断定前80回为曹公一人所写,是根据《石头记》所成,中间插入《风月宝鉴》,再增加其他成分。

数据显示,后40回并非高鹗一人所写,发现宝黛故事为一人所写,贾府衰败情景为另一人所写。

李教授用多元统计分析方法支持了红学界的观点,当时引起的轰动很大。能够用数学统计方法来印证,我猜测也是李教授在枯燥无聊的调查研究之余找到的一点小乐趣,很想知道,他当时有没有嗤笑:明明简单的事,还来一个红学派很多人研究很多年,果然自古文人最无聊哈……

上一篇下一篇

猜你喜欢

热点阅读