机器学习考试题.docxVIP

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器学习考试题 1.如果使用线性回归模型,下列说法正确的是?() A.检查异常值是很重要的,因为线性回归对离群效应很敏感 B.线性回归分析要求所有变量特征都必须具有正态分布 C.线性回归假设数据中基本没有多重共线性 D.以上说法都不对 2.以下属于无监督学习算法的选项是() a.KNN B.逻辑回归 C.SVM d.KMEANS 3.下列哪种方法常用来预测连续独立变量?() A.knn B.逻辑回顾 C.线性回归 D.以上都不对 4.以下关于逻辑回归和svm描述错误的是() A.逻辑回归是通过sign函数来进行分类的,类别为{+1,-1} B.都是分类算法 C.都是有监督学习的算法 D.在解决非线性分类问题时,svm 采用核函数 5.以下关于线性回归,说法正确的是() A.数据量较小容易造成过拟合 B.数据量较小容易造成欠拟合 c.如果假设空间较小,容易发生过拟合 D.以上说法全正确 6.以下选项中属于f1指标描述正确的选项是() A.预测正确的真正例/全部真正例 b.预测正确的真正例/被预测为真正例的所有样本数 C.预测正确的正负样本数/样本总数 D.精确率和召回率的调和平均值 7.以下哪一个选项不属于降维的作用?() a.提高 数据的可信程度 B.降维可以在压缩数据的同时让信息损失最小化 C.提高训练速率 d.降维可以缓解维度灾难问题 8.假设y与x之间是线性关系,x 是连续变量,我们用哪种图形可以最直观体现y与x的关系() A.散点图 B.柱形图 C .直方图 d.以下都不对 9.下面关于梯度下降(GD)和随机梯度下降(SGD)的描述是正确的?() A.在GD中,每一次迭代需要使用整个训练集的数据更新一个参数 B.在SGD中,每一次迭代都需要遍历训练集中的所有样本以更新一次参数 c.在GD和SGD中,每一次迭代中都是更新一组参数以最小化损失函数 d.以下说法全正确 10.在分类算法中,以下哪些选项可以进行模型评价?() A.精度 b.准确率 c.召回率 D.以下说法全正确 11.以下是目标变量在训练集上的8个实际值【1,0,0,1,1,1,1,0】,目标变量的熵是多少?() A.5/8log(3/8)-3/8log(5/8) B.5/8log(5/8)+3/8log(3/8) C.3/8log(5/8)+5/8log(3/8) D.-(5/8log(5/8)+3/8log(3/8)) 12 多选题: 13.下面哪个选项中哪一项属于确定性算法(即每次执行算法得到的结果都一致)?() a.k-means b.pca c.线性回归 d.以上说法全正确 14.在机器学习中,模型效果不好的时候,如何调试学习算法模型?() A.提升算法 b.模型参数的调节 C.特征工程 D.获取更多的数据量 15.以下说法正确的是?() A.数据标准化是将数据集转化为服从标准正态分布的数据 B.数据归一化是将每个样本的向量转化为单位向量 c.区间缩放法是对于分布较大的数据集,通过等比缩放的方法缩放到(0,1) D.以下说法全部错误 16.以下哪些选项属于距离测量方式?() A.曼哈顿距离 B.欧式距离 c.余弦相似度 d.马尔可夫链 17.以下哪些方法属于交叉验证方法?() a. 留出法 B.K折交叉验证 C.随机法 d.留一法 18.常用的机器学习工具有哪些?() a.pandas b.scikit_learn c.matplotl b D.numpy 19.以下哪些选项可以避免过拟合问题?() A.重采样bootstrap B.L1,L2正则化 c.决策树的剪枝操作 D.交叉验证 20.变量选择是用来选择最好的判别器子集,如果要考虑模型效率,我们应该做哪些变量选择的考虑?() A.多个变量是否有相同的功能 B.模型是否有解释性 C.特征是否携带有效信息 D.交叉验证 21.以下属于特征选择目标的选项是( ) A.离散程度高、 B.特征数量多 C.目标的相关性强 D.特征之间无关联 22.下列关于似然估计(MLE),说法正确的是() A.图像去噪MLE可能不存在 B.MLE总是存在 c.如果MLE存在,那么它的解可能不是唯一的 d.如果MLE存在,那么它的解一定是唯一的 23.以下关于欠拟合的说法错误的是() A.欠拟合的原因可能是模型复杂度低或者数据集太小 B.如果模型在测试集中效果不好代表模型欠拟合 C.增大数据可以有效的解决欠拟合 d.以上说法全部错误 24.经过观测样本数据的Y是X的3阶多项式,下列说法正确的是() A.简单的线性回归容易造成高偏差(bias),低方差(variance) b.简单的线性回归容易造成

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档

相关课程推荐