笔经-腾讯2018暑期实习生-数据分析岗笔试经历
发现今年虽然很多公司有了数据分析岗位面向本科生开放,但几乎数据分析师的实习笔试几乎都没有考编程,注意是几乎都没有考!这也给了我们一些启发,也说明现在的数据分析岗位职能方向更细化。
不定项选择(每题4分共25题)
1.同事小鹅在训练深度学习模型是发现训练集误差不断减小,测试集误差不断增大,以下解决方法错误的是:
(过拟合怎么处理)
数据增强
增加网络深度
提前停止训练
添加dropout
2.以下几种优化方法中,那种对超参数最不敏感?
SGD(stochastic gradient descent)
BGD(batch gradient descent)
Adadelta
Momentum
3.解微积分,求导,求极限
4.《绝地求生》休息中,共有1-3个等级的头盔,1-3个等级的防弹衣,结社你从无头盔,无房但已开始,每次之间凄美有的装备,装备换成高等级的对应装备,那么到达3级头盔,3级防弹衣,总共有多少种方法,
<比如用(x,y)表示当前(头盔,防弹衣)的级别,0无对应装备,则(0,0)->(1,0)->(1,3)-(3,3)为一种方法>
6、20、64、106
5.克莱姆法则是线性代数中一个关于求解线性方程组的定理。对一亿个具有N个方程,N个未知数的方程组,下列说法正确的是:
当方程组的系数行列式不等于零时,则方程组一定有解;
如果方程组有两个不同的解,那么方程组的系数行列式必定等于零.
如果方程组的系数行列式等于零,那么方程组一定无解
当方插入哪个组的系数行列式不等于零是,则方程组可能有多组解.
6.快排的最佳情况时间复杂度
7.鞍点上的Hessian矩阵的描述哪个是正确的(不是正定,也不是负定,也不是半正定,而是零)
正定矩阵
负定矩阵
半正定矩阵
都不对
8.样本总体在区间[-1,1]上服从均匀分布,一直样本X1,X2,…,Xn的样本均值E(X)和样本方差D(X),则D(X)=
0、1/3、1/3n、3
9.设随机变量满足:E(X)=μ,D(X)=σ²,则由切比雪夫不等式,由{|X-μ|>=4σ}<=__
1/4、1/2、1/16、1/8
10.分层抽样方法,在下面哪种情况下是比较合适的选择()
研究的总体非常小
在调研中希望了解不同子群体的差异
总体中只有一部分样本是可以调研的
没有先验的总体信息
11.对n个样本点进行无结局的的线性回归拟合,使得残差平方和最小,回归方程为y=kx,则可推导出的回归系数k为?
12.以下图像位深度神经网络**函数的函数图像,最有可能发生梯度消失的是(sigmoid函数):
13.冒泡排序对{5 7 0 9 2 3 1 4}进行从小到大排序,一共需要交换多少次
14.下图深度使用深度优先遍历的结果是
15.给定一组数据,以下哪种方法可以检验数据是否服从正态分布?
Q-Q图、wilcoxon符号秩检验、K-S检验、t检验
16.一生产线生产的产品成箱包装,假设每项平均重50kg,标准差为3kg,若用最大载重量为5000kg的汽车来承运,试用中心极限定理计算每辆车装多少箱,才能保证汽车不超载的概率大于0.84,(设φ(1)=0.84,其中φ(x)是正标准正态分布N(0,1)的分布函数)
17.下列关于协方差相关系数的说法,正确的是?(假定X,Y是两个变量)
协方差的正或负,反应两个变量X,Y是同向变化或反相变化
协方差的正或负,反应两个变量X,Y同向或反相变化的程度
两个变量的相关系数是消除量纲和标准化之后的特殊的协方差
相关系数反映两个变量每单位变化的相似程度
18.给一个数组,需要快速查找指定的一个整数是否在其中需要哪些操作
二分查找
排序
排序、二分查找
顺序遍历
19.在无线网络中分别以概率0.6和概率0.4,发出信号”0”和”1”,由于通讯系统受到干扰,当发送”0”时,接收方一概率0.8接收到”0”,概率0.2接收到”1”,当发送”1”时,接收方以概率0.9收到”1”,概率0.1收到”0”,则以下说法正确的是
(1)收到信号”0”的概率是0.52
(2)收到信号”0”时,发出信号也是”0”的概率是12/13
20.关于秩统计量,下列方法正确的是
需要总体分布符合特定分布
需要总体参数满足一定条件
不需要总体分布符合特定分布
检验统计量与总体发分布的具体参数无关
21.大数定律,和切比雪夫不等式相关
22.回归系数的运算
23、贝叶斯公式
24.高数中求导,解微积分,解方程相关的题目
25、线性代数里的秩、克莱姆法则
25、推导回归系数的过程
- 3个问答题
1.讨论机器学习模型中的偏差(Bias)和方差(Variance),并说明各种情况下的解决方法
部分作答
2.简述数理统计中假设检验的基本步骤
部分作答 ,已经结束,部分被遮盖了
3、如果微信有一个功能是用户的位置信息能够每隔1分钟上传一次数据库,那么怎么发挥它的作用?
扯了很多
个人感觉总共关注一下几个点
- 线性代数
- 统计学基础
- 概率论与数理统计
- 运筹
* 简单几个查找和排序算法(快排,冒泡)和简单数据结构(图)
* 没有编程题
* 机器学习/深度学习/神经网络基础算法和相关应用基础
* 一部分业务常识,数据敏感度
可以看出鹅厂对整体素质,要求还是很全面的,意料之外的就是几乎没有编程题
对自己来说还算比较有价值,对目前个人情况和行业情况多了些具体的认识。笔试应该是挂了,线代,数理统计,概率论的东西一两年不碰了,比较懵,考试的时候草稿也不方便打太久,估计凉凉,但希望能给想找数据分析的同学们提供一点帮助和方向。
上一篇: PHP编程计算两个时间段是否有交集的实现方法(不算边界重叠)
下一篇: 轻松掌握Java享元模式