§12.4 统计与统计案例.pptx

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高考数学新高考专用§12.4 统计与统计案例考点清单3.系统抽样?当总体中的个体比较多时,首先把总体分成均衡的若干部分,然后按照事先确定的规则,从每一部分中抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样.考点1 抽样方法与总体分布的估计1.简单随机抽样一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,那么就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法有两种:抽签法和随机数法.2.分层抽样一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.4.统计图表(1)频率分布表与频率分布直方图频率分布表与频率分布直方图的绘制步骤如下:(i)求① 极差???,即求一组数据中最大值与最小值的差;(ii)决定组距与组数;(iii)将数据分组;(iv)列频率分布表,落在各小组内的数据的个数叫做频数,每小组的频数与样本容量的② 比值叫做这一小组的频率,计算各小组的频率,列出频率分布表;(v)画频率分布直方图,依据频率分布表画出频率分布直方图,其中纵坐标(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上的小长方形的③ 面积,即每个小长方形的面积=组距×?=频率.各个小长方形面积的总和等于④ 1?.(2)茎叶图茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.(3)频率分布折线图和总体密度曲线(i)频率分布折线图:连接频率分布直方图中各小长方形上端的⑤ 中点?,就得到频率分布折线图.(ii)总体密度曲线:随着样本容量的增加,作频率分布直方图时所分的组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.5.用样本的数字特征估计总体的数字特征数字特征样本数据频率分布直方图众数出现次数最多的数据取最高的小长方形下底边中点的横坐标中位数将数据按从小到大(或从大到小)的顺序依次排列,处在最中间位置的一个数据(或中间两个数据的平均数)把频率分布直方图划分为左右两个面积相等的部分时,分界线与x轴交点的横坐标平均数样本数据的算术平均数每个小长方形的面积乘小长方形下底边中点的横坐标之和标准差:s=?.注意:方差和标准差描述了一组数据与平均数的离散程度,反映了一组数据相对于平均数的波动情况,标准差和方差越大,说明这组数据的波动性越大. 方差和标准差反映了数据波动程度的大小.方差:s2=?[(x1-?)2+(x2-?)2+…+(xn-?)2];考点2 变量间的相关关系、统计案例1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系.与函数关系不同,相关关系是一种非确定性关系.(2)利用平面直角坐标系中的点表示关于两个变量的一组数据的图形叫做散点图,由此可直观地判断两变量的关系是否可以用线性关系表示.在散点图中,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的相关关系称为负相关.2.线性回归方程(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归直线方程(i)最小二乘法:通过求Q=?(yi-bxi-a)2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(ii)回归方程:方程?=?x+?是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),……,(xn,yn)的回归方程,其中?,?是待定参数.?其中?=?? 3.相关系数r?(2)当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近0,表明两个变量之间几乎不存在线性相关关系.当r的绝对值大于0.75时,认为两个变量有很强的线性相关关系.4.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)如下: y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d 可构造一个随机变量K2=?,其中n=a+b+c+d为样本容量.(3)独立性检验利用独立性假设、随机变量K2来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.两个分类变量X和Y是否有关系的判断标准:当K2

文档评论(0)

地理知识局 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档