- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
4.1成对数据的统计相关性
新知初探·课前预习——突出基础性
教材要点
要点一相关关系
1.散点图:由坐标系及散点形成的数据图.
2.相关关系:如果两个变量之间的关系近似地表现为一条________,则称它们有线性相关关系,简称为相关关系.
3.函数关系:如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称它们线性相关,这实际上就是函数关系.
4.相关系数:一般地,对于n个成对观测数据(x1,y1),(x2,y2),…,(xn,yn),当数据{xi},{yi}(i=1,2,…,n)的标准差都不为0?时,我们称r=eq\f(\i\su(i=1,n,)(xi-x)(yi-y),\r(\i\su(i=1,n,)(xi-x)2\i\su(i=1,n,)(yi-y)2))=eq\f(\i\su(i=1,n,x)iyi-n\a\vs4\al(x)y,\r((\i\su(i=1,n,x)eq\o\al(\s\up1(2),\s\do1(i))-nx2)(\i\su(i=1,n,y)eq\o\al(\s\up1(2),\s\do1(i))-ny2)))为{xi},{yi}的相关系数.
批注?当标准差为0时,数据{xi},{yi}(i=1,2,…,n)全部相同,表明数据离散程度为0.
5.相关系数的性质:
(1)rxy值范围是[-1,1].当0rxy1时,称{xi}和{yi}________;当-1rxy0时,称{xi}和{yi}________;当rxy=0时,称{xi}和{yi}不相关.
(2)|rxy|越接近于1时,变量x,y的线性相关程度越高?,这时数据(x1,y1),(x2,y2),…,(xn,yn)分散在一条直线附近.
(3)|rxy|越接近于0时,变量x,y的线性相关程度________.
(4)rxy具有对称性,即rxy=ryx.
(5)rxy仅仅是变量x与y之间线性相关程度的一个度量.rxy=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有关系,它们之间可能存在非线性关系.
批注?统计经验告诉我们,当rxy0.8时,y有随着x的增加而增加的趋势,这时我们认为{xi}和{yi}是高度正相关的;当rxy0.8时,y有随着x的增加而减少的趋势,这时我们认为{xi}和{yi}是高度负相关的.
要点二相关系数与向量夹角
把两组成对数据分别看作n维空间的两个向量(x1,x2,…,xn),(y1,y2,…,yn),向量夹角的大小可以用余弦来刻画,我们就用余弦来刻画两个向量的相关关系.
设a=(x1-x,x2-x,…,xn-x),b=(y1-y,y2-y,…,yn-y),从
而有cos〈a,b〉=eq\f(a·b,|a||b|)=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-x)(yi-y),\r(\o(∑,\s\up6(n),\s\do4(i=1))(xi-x)2·\o(∑,\s\up6(n),\s\do4(i=1))(yi-y)2)).?
当夹角在[0,π2)
当夹角在(π2,π]
当夹角为π2时,余弦值为0
批注?用两组成对数据表示的向量在原点处夹角的余弦值与相关系数公式本质上是一致的.
基础自测
1.判断正误(正确的画“√”,错误的画“×”)
(1)若两个变量正相关,则样本相关系数大于0小于1.()
(2)相关系数越大,两个变量的相关性就越强.()
(3)若相关系数r=0,则两变量x,y之间没有关系.()
2.下列两个量之间的关系是相关关系的是()
A.匀速直线运动中时间与位移的关系
B.学生的成绩和身高
C.儿童的年龄与体重
D.物体的体积和质量
3.若变量y与x之间的样本相关系数r=-0.9832,则变量y与x之间()
A.具有很弱的线性相关关系
B.具有较强的线性相关关系
C.它们的线性相关关系还需要进一步确定
D.不确定
4.如图所示的两个变量具有相关关系的是________(填序号).
题型探究·课堂解透——强化创新性
题型1线性相关关系
例1某零售店近5个月的销售额和利润额资料如下表所示:
商店名称
A
B
C
D
E
销售额x/千万元
3
5
6
7
9
利润额y/百万元
2
3
3
4
5
(1)根据上表数据作出散点图;
(2)观察散点判断利润额y关于销售额x是否具有线性相关关系.如果具有线性相关关系,那么是正相关还是负相关?
方法归纳
两个变量是否线性相关的判断方法
巩固训练1某个男孩的年龄与身高的统计数据如下表所示.
年龄x(岁)
1
2
3
4
5
6
身高y(cm)
78
87
98
108
115
120
(1)画出散点图;
(2)判断y与x是否具有线性
您可能关注的文档
- 新教材2023版高中数学第3章概率3.1条件概率与事件的独立性3.1.4全概率公式课件湘教版选择性必修第二册.pptx
- 新教材2023版高中数学第3章概率3.1条件概率与事件的独立性3.1.5贝叶斯公式课件湘教版选择性必修第二册.pptx
- 新教材2023版高中数学第3章概率3.2离散型随机变量及其分布列3.2.1离散型随机变量及其分布课件湘教版选择性必修第二册.pptx
- 新教材2023版高中数学第3章概率3.2离散型随机变量及其分布列3.2.2几个常用的分布第2课时超几何分布课件湘教版选择性必修第二册.pptx
- 新教材2023版高中数学第3章概率3.2离散型随机变量及其分布列3.2.3离散型随机变量的数学期望课件湘教版选择性必修第二册.pptx
- 复旦转专业流程.docx
- 新教材2023版高中数学第3章概率3.2离散型随机变量及其分布列3.2.3离散型随机变量的数学期望学生用书湘教版选择性必修第二册.doc
- 新教材2023版高中数学第3章概率3.2离散型随机变量及其分布列3.2.4离散型随机变量的方差课件湘教版选择性必修第二册.pptx
- 新教材2023版高中数学第3章概率3.2离散型随机变量及其分布列3.2.4离散型随机变量的方差学生用书湘教版选择性必修第二册.doc
- 新教材2023版高中数学第3章概率3.3正态分布课件湘教版选择性必修第二册.pptx
文档评论(0)