机器学习考试题.docxVIP

下载本文档

668
1
约2.11千字
约 2页
2022-04-19 发布于江西
举报
版权申诉

机器学习考试题.docx

1、本文档共2页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

机器学习考试题 1.如果使用线性回归模型，下列说法正确的是？（） A.检查异常值是很重要的，因为线性回归对离群效应很敏感 B.线性回归分析要求所有变量特征都必须具有正态分布 C.线性回归假设数据中基本没有多重共线性 D.以上说法都不对 2.以下属于无监督学习算法的选项是（） a.KNN B.逻辑回归 C.SVM d.KMEANS 3.下列哪种方法常用来预测连续独立变量？（） A.knn B.逻辑回顾 C.线性回归 D.以上都不对 4.以下关于逻辑回归和svm描述错误的是（） A.逻辑回归是通过sign函数来进行分类的，类别为{+1，-1} B.都是分类算法 C.都是有监督学习的算法 D.在解决非线性分类问题时，svm 采用核函数 5.以下关于线性回归，说法正确的是（） A.数据量较小容易造成过拟合 B.数据量较小容易造成欠拟合 c.如果假设空间较小，容易发生过拟合 D.以上说法全正确 6.以下选项中属于f1指标描述正确的选项是（） A.预测正确的真正例/全部真正例 b.预测正确的真正例/被预测为真正例的所有样本数 C.预测正确的正负样本数/样本总数 D.精确率和召回率的调和平均值 7.以下哪一个选项不属于降维的作用？（） a.提高数据的可信程度 B.降维可以在压缩数据的同时让信息损失最小化 C.提高训练速率 d.降维可以缓解维度灾难问题 8.假设y与x之间是线性关系，x 是连续变量，我们用哪种图形可以最直观体现y与x的关系（） A.散点图 B.柱形图 C .直方图 d.以下都不对 9.下面关于梯度下降（GD）和随机梯度下降（SGD）的描述是正确的？（） A.在GD中，每一次迭代需要使用整个训练集的数据更新一个参数 B.在SGD中，每一次迭代都需要遍历训练集中的所有样本以更新一次参数 c.在GD和SGD中，每一次迭代中都是更新一组参数以最小化损失函数 d.以下说法全正确 10.在分类算法中，以下哪些选项可以进行模型评价？（） A.精度 b.准确率 c.召回率 D.以下说法全正确 11.以下是目标变量在训练集上的8个实际值【1，0，0，1，1，1，1，0】，目标变量的熵是多少？（） A.5/8log(3/8)-3/8log(5/8) B.5/8log(5/8)+3/8log(3/8) C.3/8log(5/8)+5/8log(3/8) D.-(5/8log(5/8)+3/8log(3/8)) 12 多选题： 13.下面哪个选项中哪一项属于确定性算法（即每次执行算法得到的结果都一致）？（） a.k-means b.pca c.线性回归 d.以上说法全正确 14.在机器学习中，模型效果不好的时候，如何调试学习算法模型？（） A.提升算法 b.模型参数的调节 C.特征工程 D.获取更多的数据量 15.以下说法正确的是？（） A.数据标准化是将数据集转化为服从标准正态分布的数据 B.数据归一化是将每个样本的向量转化为单位向量 c.区间缩放法是对于分布较大的数据集，通过等比缩放的方法缩放到（0，1） D.以下说法全部错误 16.以下哪些选项属于距离测量方式？（） A.曼哈顿距离 B.欧式距离 c.余弦相似度 d.马尔可夫链 17.以下哪些方法属于交叉验证方法？（） a. 留出法 B.K折交叉验证 C.随机法 d.留一法 18.常用的机器学习工具有哪些？（） a.pandas b.scikit_learn c.matplotl b D.numpy 19.以下哪些选项可以避免过拟合问题？（） A.重采样bootstrap B.L1,L2正则化 c.决策树的剪枝操作 D.交叉验证 20.变量选择是用来选择最好的判别器子集，如果要考虑模型效率，我们应该做哪些变量选择的考虑？（） A.多个变量是否有相同的功能 B.模型是否有解释性 C.特征是否携带有效信息 D.交叉验证 21.以下属于特征选择目标的选项是（） A.离散程度高、 B.特征数量多 C.目标的相关性强 D.特征之间无关联 22.下列关于似然估计（MLE），说法正确的是（） A.图像去噪MLE可能不存在 B.MLE总是存在 c.如果MLE存在，那么它的解可能不是唯一的 d.如果MLE存在，那么它的解一定是唯一的 23.以下关于欠拟合的说法错误的是（） A.欠拟合的原因可能是模型复杂度低或者数据集太小 B.如果模型在测试集中效果不好代表模型欠拟合 C.增大数据可以有效的解决欠拟合 d.以上说法全部错误 24.经过观测样本数据的Y是X的3阶多项式，下列说法正确的是（） A.简单的线性回归容易造成高偏差（bias）,低方差（variance） b.简单的线性回归容易造成