笔试题 | 网易数据分析实习生(2018)

2020-03-31  本文已影响0人  三金姐姐

//香喷喷的笔试题 001//

网易2018实习生招聘笔试题-数据分析实习生

01 统计

【题目4】均差

@知识点讲解

1.「k阶均差」
一阶均差:f[x_0,x_k]=\frac{(f(x_k)-f(x_0))}{ x_k-x_0}为函数f(x)关于节点x_0,x_1的一阶均差,记为f[x_0,x_k]

二阶均差:一阶均差f[x_0,x_1],f[x_0,x_k]的均差f[x_0,x_1,x_k]=\frac{f[x_0,x_k]-f[x_0,x_1]}{ x_k-x_1}称为函数f(x)关于节点x_0,x_1,x_k的二阶均差,记为f[x_0,x_1,x_k]

k阶均差:递归地用k-1阶均差来定义k阶均差。f[x_0,x_1,…,x_k]=\frac{f[x_0,x_1,…,x_{k-2},x_k]-f[x_0,x_1,…,x_{k-1}] }{ x_k-x_{k-1}}。称为函数f(x)关于节点x_0,x_1,…,x_kk均差。

2.「均差的对称性」
k阶均差可以表示成k+1个函数值f(x_0),f(x_1),…,f(x_k)的线性组合,即f[x_0,x_1,…,x_k]=\sum_{j=0 }^{k }\frac{f(x_j)}{ (x_j-x_0)···(x_j-x_{j-1})(x_j-x_{j+1})···(x_j-x_n)},k=1.2,…。这个性质也表明均差与节点的排列顺序无关(均差的对称性),即f[x_0,x_1,…,x_k]=f[x_1,x_0,x_2,…,x_k]=f[x_1,x_2,…,x_k,x_0]。可采用归纳法证明。

【题目5】p值检验

@知识点讲解

1.「显著性水平」
在SPSS软件中,不管是回归分析还是其它分析,都会看到Sig.(Sig=significance),意为“显著性”,后面的值就是检验的p值。

2.「检验的p值」
在一个假设检验问题中,利用样本观察值能够做出拒绝原假设的最小显著性水平称为「检验的p值」。

由检验的p值与人们心目中的显著性水平\alpha比较可以很容易做出检验的结论:

p值在实际中很有用,如今的统计软件中对检验问题一般都会给出检验的p值。

【题目6】置信区间

@知识点讲解

1.「置信区间的定义」
置信区间展现的是这个参数的真实值有一定概率落在测量结果周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。

@题目分析

这里小明在一次班干部二人竞选中,支持率为55%(真实支持率),而置信水平0.95以上的置信区间为50%到60%。也就是说他的真实支持率只有95%的几率落在50%到60%,因此它的真实支持率不足一半的可能性小于5%。这里是两人竞选,未当选也就是支持率不足一半,因此小明未当选的可能性是小于5%的,可能是3%。

【题目20】卡特兰数问题

@知识点讲解

1.卡特兰数
卡特兰数又称卡塔兰数,卡特兰数是组合数学中一个常出现在各种计数问题中的数列,以比利时的数学家欧仁·查理·卡塔兰 (1814–1894)的名字来命名。

通常用如下通项式表示:f(n)=\frac{C_{2n}^{n}}{n+1}

在实际应用中,该式常常变形为:f(n)=C_{2n}^{n}-C_{2n}^{n-1}

递推式:f(n)=\sum_{i=0}^{n-1}f(i)×f(n-i-1)

02 算法

【题目15】【题目16】树

@知识点讲解

1.树(tree)是包含n(n>=0)个节(结)点的有穷集,其中:

2.隐含条件
①空树是高度为0的树,单一节点是高度为1的树。

@题目分析

【题目15】假定树根的高度为0,求高度为6的二叉树最多有几个叶节点,是说度为0的节点有多少个,就是高度为6的节点数,共2^6=64个。

【题目17】希尔排序

@知识点讲解

1.希尔排序

@题目分析

{55,26,33,80,70,90,6,30,40,20} 增量为5, 从55开始每隔5个距离取值分为1组,共分为5组,分别为{55,90} {26,6}{33,30}{80,40}{70,20}。

先组内排序取最小值:55,6,30,40,20;后取剩余值:90,26,33,80,70。组合起来就是该数组增量取5的希尔排序的第一趟的结果。

03 EXCEL

【题目7】SUMIF函数

1.SUMIF函数解析
①作用:对单元格区域中,满足条件的单元格求和。
②语法:SUMIF(区域,条件,[求和区域])。其中
第1个参数:要判断条件的单元格区域
第2个参数:条件表达式
第3个参数:求和区域(如果省略,则对参数1区域求和)

2.按数字区间求和
本题中,公式:= SUM(SUMIF(C2:C9,{"<10","<6"})*{1,-1}),求的是满足[6,10)的销售量的和,即6+8=14。

因为大于等于6,小于10的区间可以用小于10的区间除去小于5的区间,所以先分别计算小于10的区间和小于5的区间的和{23,9}。SUMIF()*{1,-1}这是数组与数组的计算,因为最终结果为两数相减,所以这里的数组将第2个数变为负数{23,-9}。这样在后面用SUM求和时就可以让这两个数相减了。

04 数据库

【题目8】SQL的执行顺序[1]

1.SQL语句的执行顺序
MySQL的语句一共分为11步,如下图所标注的那样,最先执行的总是FROM操作,最后执行的是LIMIT操作。其中每一个操作都会产生一张虚拟的表,这个虚拟的表作为一个处理的输入,只是这些虚拟的表对用户来说是透明的,但是只有最后一个虚拟的表才会被作为结果返回。如果没有在语句中指定某一个子句,那么将会跳过相应的步骤。


MySQL的语句一共分为11步

FORM: 对FROM的左边的表和右边的表计算笛卡尔积。产生虚表VT1

ON: 对虚表VT1进行ON筛选,只有那些符合<join-condition>的行才会被记录在虚表VT2中。

JOIN: 如果指定了OUTER JOIN(比如left join、 right join),那么保留表中未匹配的行就会作为外部行添加到虚拟表VT2中,产生虚拟表VT3, rug from子句中包含两个以上的表的话,那么就会对上一个join连接产生的结果VT3和下一个表重复执行步骤1~3这三个步骤,一直到处理完所有的表为止。

WHERE: 对虚拟表VT3进行WHERE条件过滤。只有符合<where-condition>的记录才会被插入到虚拟表VT4中。

GROUP BY: 根据group by子句中的列,对VT4中的记录进行分组操作,产生VT5.

CUBE | ROLLUP: 对表VT5进行cube或者rollup操作,产生表VT6.

HAVING: 对虚拟表VT6应用having过滤,只有符合<having-condition>的记录才会被 插入到虚拟表VT7中。

SELECT: 执行select操作,选择指定的列,插入到虚拟表VT8中。

DISTINCT: 对VT8中的记录进行去重。产生虚拟表VT9.

ORDER BY: 将虚拟表VT9中的记录按照<order_by_list>进行排序操作,产生虚拟表VT10.

LIMIT:取出指定行的记录,产生虚拟表VT11, 并将结果返回。

写的顺序:select ... from... where.... group by... having... order by… limit [offset,] (rows)

执行顺序:from... where...group by... having.... select ... order by... limit


写在后面

在从小到大无数次的考试中,我们做过的选择题可能都数不清了。一般来说,选择题是整张试卷中最容易拿分的题。记得在备考雅思的时候,做雅思听力和阅读的选择题时,更多的是排错而不是选对,因为很多时候直接选择一个对的比排除几个错的困难得多。选择题更容易得分,需要我们掌握一定的方法。做工作笔试的选择题时,发现学生时代做选择题的一些方法也可以运用在其中。总结了以下方法:

✨✨✨✨✨✨✨✨✨✨✨✨✨✨✨

©一颗斯特拉
Welcome to the Stella Star!


  1. 【来源】
    https://www.php.cn/sql/421993.html

上一篇下一篇

猜你喜欢

热点阅读