sas课本要点解析.doc

  1. 1、本文档共99页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主要参考书目: [1] 盖钧镒主编. 试验统计方法[M].北京:中国农业出版社,2000. [2] 莫惠栋著.农业实验设计[M].上海:上海科学技术出版社,1992. [3] 杜荣骞. 生物统计学[M].北京:高等教育出版社,2003. [4] 李春喜,王志和,王文林. 生物统计学[M].北京:科学技术出版社,2000. [5] 洪楠,侯军编著. SAS for windows(v8)统计分析系统教程新编[M].北京:清华大学出版社,北京交通大学出版社,2004. [6] 阮桂海等编著.SAS统计分析使用大全[M].北京:清华大学出版社,2003. [7] 彭昭英著. 世界统计与分析全才SAS系统应用开发指南(上、下册)[M].北京:北京希望电子出版社,2000. [8] 卢纹岱主编. SPSS for Windows统计分析[M].北京:电子工业出版社,2000. [9] 郝黎仁,樊元、郝哲欧等. SPSS 实用统计分析[M].北京:中国水利水电出版社,2003. [10] Levine D M, Krehbiel T C, Berenson M L. Business statistics: a first course, 3rd edition[M], New Jersey: Pearson Education,2002 [11] 胡小平,王长发编著. SAS基础及统计实例教程[M].西安:西安地图出版社,2001. [12] 黄燕,吴平编著. SAS统计分析及应用[M].北京:机械工业出版社,2006. 描述统计(descriptive statistics)(复习) 第一节 反映集中性的统计数 1.算术平均数(加权算术平均数)(arithmetic mean, weighted mean) , , 2.中位数(median) 对于按次数分布表分组的资料计算公式如下: ,式中:Lmd是中位数所在组的组下限值,i是组距,fmd是中数所在组的次数,n是样本含量,C是中数前面组的累积次数。 3.众数(mode) 第二节 反映变异性的统计数 1.极差(range) 2.方差(variance) 样本,总体 3.标准差(standard deviation) 样本,总体 4.标准误(standard error of mean) 样本 第三节 反映分布情况的统计数和图 1.偏斜度(skewness) 偏斜度表示资料的分布情况,当偏斜度等于零时资料的分布是对称的,当偏斜度为正值时,分布正偏,即众数位于算术平均数的左侧;当偏斜度为负值时,分布负偏,即众数位于算术平均数的右侧, 偏斜度的计算公式为: ,(数据的三阶中心矩),利用m3有两个严重的缺点:首先带有立方的单位,其次没有计算数据变异的性质,因此没有一个绝对的含义。为了解决这一问题,将它转化为一个没有任何单位的量来表示偏斜度,转化公式如下: ,用g1判断分布是否偏斜的原则与m3相同,当|g1|=2时,偏斜就已经很大了。上式中的m2就是总体方差。(二阶中心矩) 2.峭度(峰值)(kurtosis) 也是一个度量曲线形状的一个量,用g2表示,当它等于零时,可以认为数据是服从正态分布的,当它是正值时曲线过于陡峭;当它是负值时曲线过于平坦。标准正态分布的峭度等于零,峭度的计算公式如下: , 3.四分位数(quartiles) 用来显示25%,50%,75%的百分位数。如前所述,中位数将排序后的数据分割成两部分,有50%的观察值小于它,而有50%的观察值大于它,所以可以把它叫做二分位数。四分位数将排序后的数据分割成四部分,不难理解需要我们计算的主要是第一四分位和第三四分位,计算公式如下: , 例如:有一组数据经排序后为: 9.77 11.35 12.46 13.80 15.47 17.48 18.37 18.47 18.61 20.72 21.49 22.47 31.50 38.16 q1=3.75,q3=11.25 Q1=13.8。Q3=21.49。 4.箱图(箱须图,箱线图)(boxplots , box-whisker-plot) 是一种描述数据分布的统计图形,利用它可以从视觉的角度观察变量值的分布情况,箱图主要表示变量的第二十五百分位数、中位数、第七十五百分位数等统计量。组成箱图的含义:①矩形框是箱图的主体,上中下(或右中左)三条线分别表示变量值的第75、50、25百分位数。变量的50%的观察值落在这一区域中。②触须线是中间的纵向(或横向)直线。上截止横线是变量值本体最大值;下截止线是变量值本体最小值。本体即除奇异值和极值以外的变量值。③奇异值所使用的标记为“0”。分为大小两种。箱体上方的用0标记的点,其变量值超过了第75百分位数与第25百分位数差值的1.5

您可能关注的文档

文档评论(0)

阿里山的姑娘 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档