统计推断原理和基本方法.pptx

  1. 1、本文档共121页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计推断原理和基本方法

均数的抽样误差和总体均数估计;参数估计 2. 假设检验;总体;一、抽样误差与标准误;2009年某市18岁男生身高N(167.7, 5.32)的抽样示意图 ; 将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制频数图;① ,各样本均数 未必等于总体均数; ② 各样本均数间存在差异; ③ 样本均数的分布为中间多,两边少,左右基本对称。 ④ 样本均数的变异范围较之原变量的变异范围大大缩小。 可算得这100个样本均数的均数为167.69cm、标准差为1.69cm。;1、抽样误差:;表示样本统计量抽样误差大小的统计指标。 标准误:说明抽样误差的大小,总体计算公式 (7-27);若用样本标准差s 来估计 , (7-28) ;随机抽样调查7岁男孩120名,的身高均数为120.88,标准差为5.23,则其标准误是多少? ;指标;二、t 分布;随机变量X N(m,s2); ;均数 ;(二)t 分布的图形与特征 ;;1.特征: ;2、 t界值表: 详见附表,可反映t分布曲线下的面积。 单侧概率或单尾概率:用 表示; 双侧概率或双尾概率:用 表示。 ;-t;举例: ;三、参数估计 用样本统计量推断总体参数。 总体均数估计:用样本均数(和标准差)推断总体均数。;点估计(point estimation):; 按预先给定的概率(1??)所确定的包含未知总体参数的一个范围。 总体均数的区间估计:按预先给定的概率(1??)所确定的包含未知总体均数的一个范围。 如给定?=0.05,该范围称为参数的95%可信区间或置信区间; 如给定?=0.01,该范围称为参数的99%可信区间或置信区间。;计算总体均数可信区间 需考虑: (1)总体标准差?是否已知, (2)样本含量n的大小 通常有两类方法: (1)t分布法 (2)z分布法; (1) ?未知且n比较小:按t分布;(2) 按z分布; 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64 mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的95%可信区间。 ; 故该地正常成年人血清胆固醇均数的双侧95%可信区间为(3.47, 3.81)mmol?L。 ;四、 假设检验的基本概念和步骤;举例 大规模调查表明,健康成年男子血红蛋白的均数为136.0g/L,今??机调查某单位食堂成年男性炊事员25名,测得其血红蛋白均数121g/L,标准差48.8g/L。 问题:根据资料推论食堂炊事员血红蛋白均数是否与健康成年男子血红蛋白均数有无差别;假设检验目的——判断差别是由哪种原因造成的。;炊事员血红蛋白总体均数 136.0g/L; 假定假如炊事员均数为136.0g/L,即 则 ,服从t 分布,绝大多数t应该分布在主要区域 根据 t 分布能够计算出有如此大差异的概率P ,如果P 值很小,即计算出的t 值超出了给定的界限,则倾向于拒绝H0,认为山区血红蛋白均数不是136.0g/L;;假设检验的基本思想—利用小概率反证法的思想;1.建立检验假设,确定检验水准(选用单侧或双侧检验) (1)无效假设,记为H0; (2)备择假设,记为H1。 对于检验假设,须注意: 1)检验假设是针对总体而言,而不是针对样本; 2)H0和H1是相互联系,对立的假设,后面的结论是根据H0和H1作出的,因此两者不是可有可无,而是缺一不可;3)H1的内容直接反映了检验单双侧。若H1中只是? ??0 或只是 ? <?0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。 4)单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。 ; (3) 检验水准?,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取? = 0.05。可根据不同研究目的给予不同设置。 例如本题: ;2. 计算检验统计量 根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等(如数据的分布类型)选择相应的检验统计量。 如 t 检验、z检验、F检验和 检验等。;本例采用t检验方法 本例t值为1.54 ; 是指根据所计算的检验统计量确定H0成立的可能性大小,即确定在检验假设条件下由抽样误差引起差别的概率。 ;本例查t界值表 自由度v=24,t=1.54 按照a=0.05的水

文档评论(0)

haowendangqw + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档

相关课程推荐