0第1讲数据分析引论.pptx

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
;前言;数据分析 Analyzing Data; 第一讲 引论与数理统计基础引论 学者不能离开统计而研究,政治家不能离开统计而施政,企业家不能离开统计而执业 --- 马寅初 统计学是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。 让“数据”说真话,即对“数据”进行分析。 ;三类现象;不同现象与研究方法; 数据分析; 统计 参数 点估计 估计 非参数 区间估计 统 u检验 计 参数 t检验 推 F检验 断 假设 检验 卡方检验 非参 秩和检验 秩相关检验 统计方法:一元、多元统计分析,非参数方法,半参数方法,BAYES统计??析,时间序列分析 ;重点:参数估计的思想和方法;假设检验的思想和方法; 难点:假设检验的思想、方法、操作及计算结果的分析; 补充:查资料的方法,核心期刊介绍, SPSS软件及安装,阅读软件等; 延伸:以往课程设计中的参数估计与假设检验的案例。 ;统计软件的重要作用; 数理统计统计基础; 为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样本中所包含的个体数目称为样本容量.;但是,一旦取定一组样本,得到的是n个具体的数 (x1,x2,…,xn),称为样本的一次观察值,简称样本值即数据 .;简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,…,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.;事实上我们抽样后得到的资料都是具体的、确定的值. 如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本. 我们只能观察到随机变量取的值而见不到随机变量.;总体(理论分布) ? ; 由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它???样本中所含的(某一方面)的信息集中起来.;例1:设X1,X2,…,Xn是来自总体X的一个样本,X~N(?,?2), 且?已知, ?2 未知,问下列样本函数哪个是统计量?; 几个常见统计量; 2. 抽样分布;记为;分布的密度函数为;由 分布的定义,不难得到:;;T分布的密度函数为:;具有自由度为n的t分布的随机变量T的数学期望和方差为: E(T)=0; D(T)=n / (n-2) , 对n >2 ;由定义可见,;当总体为正态分布时,给出了几个重要的抽样分布定理. ;n取不同值时样本均值 的分布;n取不同值时 的分布; 定理2;总体;五 参数的假设检验;1. 假设检验的步骤;F 检验 用 F分布;2、单正态总体的参数假设检验; (2)选择统计量:; (2)选择统计量:;例2 以往一台机器生产的垫圈的平均厚度为0.050厘米,为了检查这台机器是否处于正常工作状态,现抽取10个垫圈,测得其平均厚度为0.053厘米,样本方差为0.00322, 在显著水平?=0.01下,检验机器是否处于正常工作状态。;接受域;例3.某炼铁厂铁水含碳量在正常情况下服从方差为0.1122的正态分布,现对操作工艺进行了改变,从中抽取7炉铁水测得含碳量如下:4.421,4.052,4.357,4.394,4.326,4.287,4.683. 问新工艺炼出的铁水含量的方差有无明显改变?(? =0.05);3、两个正态总体的参数假设检验;例4 设A厂生产的灯泡的使用寿命X~N(?1,952), B厂生产的灯泡的使用寿命Y~N(?2,1202)。在两厂产品中分别抽取了100只和75只样本,测得灯泡的平均寿命分别为1180小时和1220小时。问在显著性水平?=0.05下,这两个厂家生产的灯泡的平均寿命有无显著差异?;(4)将样本观测值代入,;2.?12=?22 =

文档评论(0)

王子 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档