数据爬取与可视化大数据玩转大数据

我们分析了10万个圆圈,了解到文化是如何塑造我们的习惯

2018-02-22  本文已影响3人  Jayden_xue

编译:Jayden

首先,让我们来做一个小实验,不需要准备也别想太多,尽量用直觉。

请你用“☝️食指”在下方空白处画一个圆圈。

当你在随意画一个圆时,有没有考虑过你是从顶部还是底部开始的?是顺时针还是逆时针?这些无聊到几乎被所有人忽略的信息,在大数据的帮助下能判断出你来自哪里。

前一阵谷歌Google发布了一款名为“Quick,Draw” (快速绘画)的在线游戏,要求玩家用20秒的时间按照提示画出物体,比如骆驼、洗衣机等。

这个游戏看似很有趣,但其背后的目的是通过这些速成的草图,让程序算法来学习人类是如何画画的。截止2017年五月,该游戏已经收集到了50万张独一无二的绘画草图。

分析师使用此数据库进行分析,比较世界各地的人是如何绘制基本的几何形状。最终得出的结论: 

绘制一个简单圆圈的方式,与你的地理位置和文化素养有关,这种文化素养来自于数百年来的书面语言传统。

圆圈,一个朴素却有魔力的图案

圆圈是一个在世界范围内十分普遍的图案。

它受到古希腊人的崇拜,对伊斯兰艺术有重要影响,还在佛教中受到崇敬。

在任何场合,似乎都能留意到它的痕迹。

对于一笔绘制圆圈,不管从哪里开始,实际上只有两种方法:顺时针与逆时针。

谷歌依据来自148个国家的119000个圆圈,以及人们的绘画路径坐标,最终得出了不同国家,喜好画圆圈的不同方式。

如上图所示,美国人倾向于逆时针画圆,但日本人则倾向反方向画圆,有80%的日本人是采用顺时针的方式。

以下是每个国家抽取100个样本的数据分析:

●代表和汉字书写体系  

分析指出,英国、捷克、澳大利亚和芬兰人的画圈方式和美国人一样,在有的国家,比如越南,有95%的抽样都是使用逆时针的方式。

可以说世界上大部分地区都采用逆时针的方式,但却只有两个例外:台湾和日本。 

绘画语言

那么到底是什么导致了这样的绘画差别?

答案就是我们本身使用的“语言”。

不同的语言将不同国家的画圈方式做出了区分。人们的写作方式是从左到右还是从右到左, 导致了不同的手写习惯。虽然美国,西欧和南美的口头语言差异很大,但是却有相似的书写逻辑。亚洲和中东在语言书写方面却有截然不同的规则。

下面是一些有代表性的语言群体(地区):

在日语中,有三种类型的文字:平假名hiragana, 片假名katakana, 和日本汉字kanji。与英文最接近的平假名有着最多的圆形笔画,其曲线大部分都是顺时针来绘制的。

在日文和汉字的书写体系中,都对笔顺有着严格的要求,总的来说是从右下方到左上方。在此体系中,类似这样的规则从学生拿起铅笔开始,就印在了他们的脑袋里。虽然此次试验没有采集到中国的数据,但是根据一项来自中国1985年的调查研究显示,在151名测试者中有72%采用了顺时针的方式画圆。

如果我们来看一看另一个形状,“三角形”,的数据统计,结论会更加明显:

红色三角为汉字书写体系,蓝色为“从右到左”的书写体系

从三角形的结果来看,采用汉字系统的国家相似性就很强了,97%的台湾人和90%的日本人和韩国人都选择逆时针绘制。但埃及和伊拉克等国家则偏好顺时针方向。相比之下美国的的两种画法都在50%左右。

在汉字系统中,笔画顺序对于有三角形结构的文字,一般采用从右到左,再从左到右的方式来绘制。这个“人”的例子就十分明显。当然这种书写方式在那些“从右往左”来书写的国家就截然相反,比如阿拉伯联合酋长国、科威特、沙特阿拉伯和以色列。

总的来说有很多证据可以证明书写习惯可以影响人们绘制形状的方式,但是这个理论并不能解释所有的案例。比如使用汉字的香港,却有82%的人使用逆时针来画圆。

是什么造就了我们的“习惯”?

你可能早已忘记在学习第一个英文字母时的场景,或许那时的你根本不在意大小写字母的笔画顺序,错了也就这样一直错了很多年,毕竟现在都用键盘敲字。

但有时,笔画顺序则是写作的首要条件。在日语和汉语中,笔画顺序被认为是书写的重要组成部分,甚至可以代表你的教育水平。想象在公开场合在众人面前,写出一个“倒笔画”,是一件多么尴尬的事。

尽管数据分析人员依据大数据,帮我们总结了以上结论,但仍然有很多我们并不知道。也许有一天我们不再手写,只用键盘记录和表达我们的感情记忆。在那时我们也许会更加注意到敲打键盘所带来的文化差异,从而又有一篇崭新的“键盘使用状况”的报告出炉。今天关于“画圈”的结论也许就会成文一堆废纸,变得毫无意义。

是什么造就了我们的“习惯”,以至于这些“习惯”最后成为了我们现行社会下的“规则”?这似乎一直是社会学家花费大量时间的课题。但从今往后,也许数据学者能为此带来重要的帮助。 

人发明的工具分两类,

第一类是能直接帮助提升我们效能的工具,比如工厂的机械手臂和家里的梯子。

第二类则是辅助人们生活的工具,这类工具的效能并不明显,有的还可能被认为是无用的,但这类工具却能在另一个纬度帮助我们, 就好比单看“电磁波”,这只是一个物理概念,但它却在另一个纬度帮助我们完成了众多科技革新。

在我看来,很明显大数据和信息系统就是这里所说的第二类工具。它在技术的层面帮我们绘制了一幅之前很难看见、了解甚至想象的社会框架。

从而帮助我们更好的解答那个终极课题:

了解我们自己。

原文来自 QUARTZ

「Jayden」

好久不见,甚是想念

唯有关注,方能解忧

上一篇下一篇

猜你喜欢

热点阅读