Data Analysis Interview

题目21-30

2019-05-01  本文已影响18人  快乐自由拉菲犬

21:双盲实验的含义(Double-blind trials)

双盲实验是指被试和实验者都不知道哪些被试接受哪一处理的实验技术。

这种实验方法用于防止研究结果被安慰剂效应( placebo effect)或者观察者偏爱(observer bias)影响。

双盲实验(Double-blind trials)
双盲实验是一种更加严格的实验方法,通常适用于以人为研究对象的实验(human subjects),旨在消除可能出现在实验者和参与者意识当中的主观偏差(subjective bias)和个人偏好(personal preferences)。在大多数情况下,双盲实验要求达到非常高的科学严格程度。
在双盲实验中,实验者和参与者都不知道哪些参与者属于对照组(control group)、哪些属于实验组(experimental group)。只有在所有数据被记录完毕之后(在有些情况下是分析完毕之后),实验者才能知道那些参与者是哪些组的。采用双盲实验是为了要减少偏见(prejudices)和无意识地暗示(unintentional physical cues)对实验结果的影响。对于被试者的随机分配(Random assignment)到对照组或者实验组的做法是双盲实验中至关重要的一部。确认哪些受试者属于那些组的信息交由第三方保管,并且在研究结束之前不能告知研究者。


22: 单盲试验(Single-blind trials)

单盲实验指的是这种实验:在实验中可能引起个人偏好或者使实验结果发生偏差的信息不向实验的参与者(participant)提供,而实验的实验者(experimenter)却完全掌握关于实验的所有信息。
在单盲实验中,实验参与者不知道他们是属于被试组(test subjects)还是属于实验控制组(experimental control groups)。单盲实验一般以下这情况:(1)实验者知道实验的全部信息,并且(2)实验者不会在自己知道所有实验情况下对实验结果产生偏差,因此没有必要使实验者盲。但是,可能的风险是实验的参与者在与观察者交流后受到他们的影响,即实验者自己的偏好被传递给了参与者造成实验的偏差。单盲实验在心理学和社会科学研究中具有风险,因为实验者对结果的预期可能会有意识或者下意识地影响参与者而造成偏差


23:用一种编程语言,实现1+2+3+4+5+.....+100

选择用Python


24:实现求1,2,3,...100之间的质数

质数定义为在大于1的自然数中,除了1和它本身以外不再有其他因数

质数又称素数。一个大于1的自然数,除了1和它自身外,不能被其他自然数整除的数叫做质数;否则称为合数

1和2都是质数。


25. 描述统计含义?

描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。


26. 集中趋势分析

集中趋势分析主要靠平均数、中数、众数等统计指标来表示数据的集中趋势。例如被试的平均成绩多少?是正偏分布还是负偏分布?


27.离中趋势分析

离中趋势分析主要靠全距、四分差平均差、方差、标准差等统计指标来研究数据的离中趋势。例如,我们想知道两个教学班的语文成绩中,哪个班级内的成绩分布更分散,就可以用两个班级的四分差或百分点来比较。


28.相关分析

相关分析探讨数据之间是否具有统计学上的关联性。这种关系既包括两个数据之间的单一相关关系——如年龄与个人领域空间之间的关系,也包括多个数据之间的多重相关关系——如年龄、抑郁症发生率、个人领域空间之间的关系;既包括A大B就大(小),A小B就小(大)的直线相关关系,也可以是复杂相关关系(A=Y-B*X);既可以是A、B变量同时增大这种正相关关系,也可以是A变量增大时B变量减小这种负相关,还包括两变量共同变化的紧密程度——即相关系数。实际上,相关关系唯一不研究的数据关系,就是数据协同变化的内在根据——即因果关系。获得相关系数有什么用呢?简而言之,有了相关系数,就可以根据回归方程,进行A变量到B变量的估算,这就是所谓的回归分析,因此,相关分析是一种完整的统计研究方法,它贯穿于提出假设,数据研究,数据分析,数据研究的始终。


29.假设检验

假设检验推论统计中用于检验统计假设的一种方法。而“统计假设”是可通过观察一组随机变量的模型进行检验的科学假说。[1]一旦能估计未知参数,就会希望根据结果对未知的真正参数值做出适当的推论。

统计上对参数的假设,就是对一个或多个参数的论述。而其中欲检验其正确性的为零假设(null hypothesis),零假设通常由研究者决定,反映研究者对未知参数的看法。相对于零假设的其他有关参数之论述是备择假设(alternative hypothesis),它通常反映了执行检定的研究者对参数可能数值的另一种(对立的)看法(换句话说,备择假设通常才是研究者最想知道的)。

假设检验的种类包括:t检验Z检验卡方检验F检验等等。

假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。

假设是否正确,要用从总体中抽出的样本进行检验,与此有关的理论和方法,构成假设检验的内容。设A是关于总体分布的一项命题,所有使命题A成立的总体分布构成一个集合h0,称为原假设(常简称假设)。使命题A不成立的所有总体分布构成另一个集合h1,称为备择假设。如果h0可以通过有限个实参数来描述,则称为参数假设,否则称为非参数假设(见非参数统计)。如果h0(或h1)只包含一个分布,则称原假设(或备择假设)为简单假设,否则为复合假设。对一个假设h0进行检验,就是要制定一个规则,使得有了样本以后,根据这规则可以决定是接受它(承认命题A正确),还是拒绝它(否认命题A正确)。这样,所有可能的样本所组成的空间(称样本空间)被划分为两部分HA和HR(HA的补集),当样本x∈HA时,接受假设h0;当x∈HR时,拒绝h0。集合HR常称为检验的拒绝域,HA称为接受域。因此选定一个检验法,也就是选定一个拒绝域,故常把检验法本身与拒绝域HR等同起来


30.参数估计

参数估计(parameter estimation),统计推断的一种。根据从总体中抽取的随机样本来估计总体分布中未知参数的过程。从估计形式看,区分为点估计与区间估计:从构造估计量的方法讲,有矩法估计、最小二乘估计、似然估计、贝叶斯估计等。要处理两个问题:(1)求出未知参数的估计量;(2)在一定信度(可靠程度)下指出所求的估计量的精度。信度一般用概率表示,如可信程度为95%;精度用估计量与被估参数(或待估参数)之间的接近程度或误差来度量。

上一篇下一篇

猜你喜欢

热点阅读