统计学原理第五章 抽样调查与参数估计.ppt

统计学原理第五章 抽样调查与参数估计.ppt

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学原理第五章 抽样调查与参数估计

第五章 抽样调查与参数估计 主要内容 抽样调查与抽样组织形式 参数估计的基本原理 一个总体参数的区间估计 样本容量的确定 参数估计在统计方法中的地位 第一节 抽样调查与抽样组织形式 一、抽样调查的特点 1.按随机原则抽取样本 2.可以用样本资料推断总体数量特征 3.推断结果必然产生抽样误差,但可以估计并进行控制。 抽样调查的作用与优点 1.对于一些不可能、不必要进行全面调查的现象进行调查 2.对全面调查的资料进行补充和修正 3.具有很强的经济性、时效性、准确性、灵活性 二、基本概念 (一)总体与样本 总体:研究事物的全体,是由若干的个体即总体单位组成。 样本:从总体中随机抽取的一些个体组成的集合。 大样本、小样本 (二)参数与统计量 参数:描述总体特征的指标;常数,通常未知,需要用样本数据进行估计 统计量:样本指标;不确定的、非唯一的;是随机变量。 常见的参数与统计量 (三)抽样框 抽样框:有关总体全部单位的名录 实施抽样的基础 (四)重复抽样与不重复抽样 抽样调查的工作步骤 1.设计调查方案(如何抽、抽多少) 2.抽取样本 3.调查(搜集资料) 4.计算统计量 5.推断总体数量特征或方差分析、假设检验 三、抽样的组织形式 (一) 简单随机抽样 (二)分层(类)抽样 (三)系统抽样(机械抽样) (四)整群抽样 (五)多阶段抽样 第二节 抽样分布 一、分布 总体分布 样本分布 抽样分布 二、抽样误差 重复抽取容量为n 的样本时,统计量所有可能的取值形成的相对频数分布称为抽样分布。 抽样分布实际上是一种理论分布。 抽样分布提供了样本统计量长远而稳定的信息,是进行推断的理论基础和重要依据。 从4个人中随机抽取2人(重复抽样、考虑顺序),可能的样本有12个,其样本的平均数如下表。 结论 1.如果总体服从正态分布,样本均值均服从正态分布。 2.如果总体为非正态分布,若样本容量充分大,样本均值近似服从正态分布; 3.如果总体为正态分布,样本容量比较小,则样本均值进行标准化以后的随机变量服从自由度为n-1的t分布。 4.当样本容量足够大时,样本比例近似服从正态分布, 二、抽样平均误差 样本指标的标准差称为抽样平均误差 它反映了所有可能样本的估计值与总体参数的平均差异程度。 实际中不可能用上面的公式计算 计算公式为: (一)样本均值的抽样平均误差 (二)样本比例的抽样平均误差 若总体标准差 σ、总体比例P未知,则: 1.用总体过去的σ、 P; 2.用样本的标准差和比例,即s、p; 第三节 参数估计 一、 估计量及其评价标准 用来估计总体参数的统计量称为估计量 评价估计量的标准 : 1.无偏性:估计量的数学期望等于被估计的总体参数 2.有效性:估计量的方差越小,则估计就越有效 3.一致性:指随着样本容量的增大,估计量的值越来越接近被估计总体的参数 二、参数估计的方法 点估计 区间估计 三、对一个总体参数的区间估计 (一)总体均值的区间估计 大样本 :在1-α置信水平下的置信区间 要点:样本均值、抽样平均误差、Z值 例:75页 正态分布 置信水平F(Z) Z值 95% 1.96 95.45% 2 90% 1.64 【例5-4 】某学校对教职工缴纳个人所得税的情况进行了调查。全校教职工总人数为2000人,采用重复抽样的方法随机抽取了50人,样本资料如下: 875 630 345 210 670 231 78 309 189 77 123 99 167 198 890 276 89 438 112 …… 试以95%的置信水平估计该校教职工人均缴纳所得税的置信区间。 解: 1.样本均值 =(875+630+345+……+73)=254.5 2.样本标准差 3.抽样平均误差 4.该校教职工人均交纳个人所得税的置信区间为: 即196.24元到312.76元 (二)总体比例的区间估计 大样本 :在1-α置信水平下的置信区间 【例5-6】某电视台委托调查公司调查一个电视谈话节目的收视率,调查公司随机调查了200户家庭,结果有44户家庭经常收看该节目。试以90%的置信水平估计该节目收视率的置信区间。 解:样本收视率p=44/200=22%, 置信水平90%,则Z=1.64 抽样平均误差 则该节目收视率在90%的置信水平下的置信区间为: (22%-1.64*0.029,22%+1.64*0.029),即17.2%到26.8%之间 【例】随机抽取100件产

您可能关注的文档

文档评论(0)

pangzilva + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档