- 1、本文档共139页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
成对数据的统计相关性
一元线性回归模型及其应用 P38
列联表与独立性检验 P99;第八章 成对数据的统计分析;商家要根据顾客的意见改进服务水平,希望了解哪些因素影响服务水平,以及这些因素是如何起作用的;等等.为此,我们需要进一步学习通过样本推断变量之间关系的知识方法.
本章的学习内容有成对数据的统计相关性、一元线性回归模型和2×2列联表, 这些知识与方法在解决实际问题中非常有用. 可以发现,两个随机变量的相关性可以通过成对样本数据进行分析; 利用一元线性回归模型可以研究变量之间的随机关系, 进行预测;利用2×2列联表可以检验两个随机变量的独立性. 本章的学习对于提高我们解决实际问题的能力,提升数据分析、数学建模等素养都是非常有帮组的.;8.1 成对数据的统计相关性;我们知道, 一个人的体重与他的身高有关系. 一般而言, 个子高的人往往体重值较大, 个子矮的人往往体重值较小,但身高并不是决定体重的唯一因素, 例如生活中的饮食习惯、体育锻炼、睡眠时间以及遗传因素等也是影响体重的重要因素. 像这样, 两个变量有关系, 但又没有确切到可由其中的一个去精确地决定另一个的程度, 这种关系称为相关关系.
两个变量具有相关关系的事例在现实中大量存在. 例如: 1.子女身高y与父亲身高x之间的关系. 一般来说, 父亲的个
子高, 其子女的个子也会比较高; 父亲个子矮, 其子女的个子也会比较矮, 但影响子女身高的因素, 除父亲身高外还有其他因素, 例如母亲身高、饮食结构、体育锻炼等, 因此父亲身高又不能完全决定子女身高.;2.商品销售收人 y与广告支出x之间的关系. 一般来说,;因为在相关关系中, 变量 y 的值不能随变量 x 的值的确定而唯一确定, 所以我们无法直接用函数去描述变量之间的这种关系. 对上述各例中两个变量之间的相关关系, 我们往往会根据自己以往积累的经验作出推断. “经验之中有规律”, 经验的确可以为我们的决策提供一定的依据,但仅凭经验推断又有不足, 例如, 不同经验的人对同一情形可能会得出不同结论, 不是所有的情形都有经验可循等.
因此, 在研究两个变量之间的相关关系时, 我们需要借助数据说话. 即通过样本数???分析, 从数据中提取信息,并构建适当的模型, 再利用模型进行估计或推断.;探究! 在对人体的脂肪的含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如表所示, 表中每个编号下的年龄和脂肪含量数据都是对同一个体的观测结果, 它们构成了成对数据.;为了更加直观地描述上述成对样本数据中脂肪含量与年龄的关系,类似于用直方图描述单个变量样本数据的分布特征,我们用图形展示成对样本数据的变化特征.;观察散点图可以发现,这些散点大致落在一条从左下角到右上角的直线附近,表明随年龄值的增加,相应的脂肪含量值呈现增加的趋势. 这样, 由成对样本数据的分布规律,我们可以推断脂肪含量变量和年龄变量之间存在着相关关系.
如果从整体上看, 当一个变量的值增加时, 另一个变量的相应值也呈现增加的趋势, 我们就称这两个变量正相关.当一个变量的值增加时, 另一个变量的相应值也呈现减少的趋势,称这两个变量负相关.;思考? (1)两个变量负相关时,成对样本数据的散点图有什么特点?
(2)你能举出生活中两个变量正相关或负相关的一些例子吗?
散点图中的点散布在从左上角到右下角的区域.
散点图是描述成对数据之间关系的一种直观方法. 观察前面散点图, 从中我们不仅可以大致看出脂肪含量和年龄呈正相关, 而且从整体上可以看出散点落在某条直线附近.
一般地, 如果两个变量的取值呈现正相关或负相关, 而且散点落在一条直线附近, 我们就称这两个变量线性相关.;观察下面散点图,我们发现:
图(1)中的散点落在某条曲线附近,而不是落在一条直线附近,说明这两个变量具有相关性,但不是线性相关;
类似地,图(2)中的散点落在某条折线附近,这两个变量也具有相关性,但它们既不是正相关,也不是负相关;;图(3)中的散点杂乱无章,无规律可言,看不出两个变量有什么相关性.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.;变量的相关关系
散点图
变量相关关系的分类;8.1.2 样本相关系数;通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关等.
散点图虽然直观,但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.能否像引入平均值、方差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析呢?;利用上述方法处理表中的数据, 得到下图. 我们发现,这时的散点大多数分布在第一象
您可能关注的文档
- 4.3图形图像的加工--背景制作.ppt
- 医药医疗器械安全评价系统模型和评价系统数据库的软件开发.pptx
- 幼儿园教育教学活动设计方案(4篇).docx
- 写人三年级作文锦集七篇.docx
- 幼儿教学心得体会8篇.docx
- 4篇纪检监察干部教育整顿自查自纠六个方面检视报告.docx
- delphi教学信息管理系统系统答辩稿.pptx
- 小学一年级家长会PPT (2)课件.pptx
- 2023年物理的电路教学反思集锦篇.docx
- 石河子大学《MATLAB基础与应用》课件-第6章SIMULINK基础.pptx
- GB/T 29324-2024架空导线用碳纤维增强复合材料芯.pdf
- 《GB/T 29324-2024架空导线用碳纤维增强复合材料芯》.pdf
- GB/T 43905.1-2024焊接及相关工艺中烟尘和气体取样的实验室方法 第1部分:电弧焊中烟尘排放速率的测定和分析用烟尘的收集.pdf
- 《GB/T 43905.1-2024焊接及相关工艺中烟尘和气体取样的实验室方法 第1部分:电弧焊中烟尘排放速率的测定和分析用烟尘的收集》.pdf
- 中国国家标准 GB/T 43905.1-2024焊接及相关工艺中烟尘和气体取样的实验室方法 第1部分:电弧焊中烟尘排放速率的测定和分析用烟尘的收集.pdf
- 中国国家标准 GB/T 18910.21-2024液晶显示器件 第2-1部分:无源矩阵单色液晶显示模块 空白详细规范.pdf
- GB/T 18910.21-2024液晶显示器件 第2-1部分:无源矩阵单色液晶显示模块 空白详细规范.pdf
- 《GB/T 18910.21-2024液晶显示器件 第2-1部分:无源矩阵单色液晶显示模块 空白详细规范》.pdf
- GB/T 43860.1220-2024触摸和交互显示 第12-20部分:触摸显示测试方法 多点触摸性能.pdf
- 中国国家标准 GB/T 43860.1220-2024触摸和交互显示 第12-20部分:触摸显示测试方法 多点触摸性能.pdf
1亿VIP精品文档
相关文档
最近下载
- 2023年第四届“红旗杯”班组长大赛考试题库附答案(含各题型).docx VIP
- 南宁网约车区域科目考试题库.pdf
- 2023年“红旗杯” 第四届全国机械行业班组长管理技能大赛考试题库.docx VIP
- 清华同方水源热泵中央空调.doc VIP
- 2024年高考语文一轮复习讲练测(新教材新高考)第03讲小说形象类题目(讲义)(原卷版+解析).docx VIP
- 守纪律讲规矩党课课件.pptx VIP
- SGHP清华同方水源热泵操作说明技术手册.pdf VIP
- 第三次全国土壤普查理论考试题 (含答案).docx VIP
- 安徽省近5年中考语文作文真题及模拟题汇编(含参考例文).docx VIP
- 通桥(2017)2101-Ⅰ时速160公里客货共线铁路预制后张法简支T梁(钢横梁人行道方案)32m.pdf
文档评论(0)