一个PhD和一群网络骗子的日常
研究资讯科技教育的我和老妈日常电话里突然暴怒一句:科技就是个P。
源起我帮导师的一个项目:在网络上发研究问卷以及部分参与者可以参加面试(email面试,仅限文本)。研究对于大多数人都是无聊的,尤其是教育类的研究,满屏废话的即视感,哪怕是我自己都经常想:教育救国?呵呵~但是好在导师有本事,项目里大部分资金几乎大部分用于研究参与者的补偿发放以吸引更多的参与者。这倒是见好事,对我来说更容易激起参与者的欲望,毕竟每个人得到的回馈也是挺多的,相比其他研究项目来说。问题就在于没引来“小白兔”倒是来了一群的“大灰狼”。
故事可以从我用什么来收集数据开始。作为社科类的研究,使用调查问卷来收集数据是经常的事,只不过这一次限于参与者之广,我使用了一些网络问卷收集的平台。利用社交网络的便利,一切看着方便且极好的。理想主义者的我就此给科技的便利一个赞。
导师要求的参与者数量有些大,我还觉得有点压力,压力在于这么多钱可能发不出去,同时也第一次给我了一种老子有钱花不完的大爷劲。问卷分中英文,各有一个链接,首先出现大批量数据涌入的是英文的。自个儿内心一顿狂欢:我就是这么lucky!可是看着这些数据总是有些怪怪的,数据很整齐,英文名都是First name Given name Last name的排列,出奇的整齐,邮箱也是齐刷刷的名字@gmail.com。只是有部分问题让我觉得有点纳闷。这里要说明的是我的研究是关于网络课程,一般来说看视频不应该是大多数人的首要学习行为吗?疑问一来了:在这些人里面,几乎很少有人把这个选项作为他们网络课程学习的首要选择。好吧,姑且当作文化不同,课程不同,活动参与形式不同。怀疑是种好习惯,自我怀疑加批评也是作为研究者的好美德。疑问二:后面的问题有一些本来是反向回答的问题(也就是说有些问题在一堆问题里面它的答案应该是个其他的问题是相反的,目的在于检测参与者的认真程度)。不过这些人(大概800来个当时,现在有将近1000个)答的非常错乱,因为也不好一棍子打死,也有可能是因为问卷本身的问题,所以也就还是没有确定这是不是乱填的。疑问三:参与者似乎有组织有纪律的按照每五分钟两位的进度填写问卷,我第一想到的是是不是被黑了。这个疑问激起了我的极大的怀疑。不过没事,有招可以试出来。有些“人”(我觉得是机器做的)在问卷里接受了进一步的采访邀请(有另外的回馈)。我就发了一批给他们(应该是人或者骗子做的,毕竟什么人工智能还没有那么神乎)。真的有回复诶,只是疑问四来了:英文问卷我主要针对的是国外的native speaker。采访问卷的回复极其的low,所有问题几乎都是用最low爆的小学英语(不好意思,我说的是骗子的水准)回答我的问题。而且,同一组发出的采访问卷全部都是一模一样的答复。所以可以确认这批数据是无效的。
接下来,中文问卷也沦陷了,大批量的163,qq,126的邮箱填写的问卷一开始又让我兴奋了一会。不过慢慢观察,163的邮箱主要是三个字母和三个数字组成的邮箱。应该不用看了,全部删掉。126的邮箱基本是一连串毫无规律的字母,也全部删掉。qq的我总以为不太可能假吧?毕竟得有qq号?错了也可以批量生产,不懂的话可以百度一下。可是我已经信任的发出去了一批。包括采访。采访的信息倒是和问卷上的一样,让我感觉好像真的。可是回答的问题,有些让我觉得猜不透。
太晚了,明天继续......