第二讲计量资料的统计描述1.pptVIP

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二讲计量资料的统计描述1

第二讲 (数值变量的统计描述) 王晓莉 xlwang@bjmu.edu.cn 基本内容(小复习) 数值变量的统计描述,描述什么? 描述的对象:数值变量,群体 群体特征的描述:一般先有一个变量,然后会有一系列的变量值,这些变量值就是一个群体。 针对这样一个群体,你想知道什么?(共性与特性,有群体就有变异) 同样是数值变量,但其特点又各不相同(分布问题:正态与非正态,计算均数时也不同) 主要内容 频数表 集中趋势 离散趋势 正态分布 正常值范围估计 一. 频 数 表 2000年100名2岁男童身高频数分布 2000年100名2岁男童身高频数分布 二、集中趋势(集中位置的描述) 1.算术均数 2.几何均数 3.中位数 1.算术均数(均数) 意义:一组性质相同的观察值在数量上的平均水平。 表示 ?(总体) X(样本) 特征: ∑(X- X)=0 估计误差之和为0。 应用:正态分布或近似正态分布 注意:合理分组,才能求均数,否则没有意义。 缺点:对极值很敏感 例题: 100名2岁以下男童身高均数的计算 直接法、间接法、计算机 结果:84.8cm 有8份抗体血清的抗体效价分别为1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640, 求平均抗体效价。 2.几何均数 意义:N个数值的乘积开N次方即为这N 个数的几何均数。 表示:G 计算: 应用:原始数据分布不对称,经对数转换后呈对称分布的资料。例如抗体滴度。 有5份抗体血清的抗体效价分别为1:2,1:4,1:8,1:16,1:32, 求平均抗体效价。 3.中位数、百份位数 一系列数据的“中点” 一半(50%)的个体在该点上面,一半(50%)的个体在该点下面。 中位数(M) :将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。 排序后处于25%和75%位置上的值 三、离散趋势(离散程度的描述) 描述一组数据参差不齐的程度 是不同数值间差异性测量 是每个数值与“特定值”的差异程度 常用指标 全距 四分位数间距 方差 标准差 变异系数 R :最大最小值之差。 Q:上四分位数(P75)Qu与下四分位数Ql (P25)之差,中间包含了全部观察值的一半。 2.标准差 是一组数据变异的平均水平 是每个数据与“均值”的平均“距离” 是标准化的“某值”的偏差 标准差的符号: S ? 相关概念(公式过程表示): 离均差 离均差之和 离均差平方和 方差(?2 S2 ) 标准差( S ? ) 标准差的计算(公式): 例题: 100名2岁男童身高标准差的计算 结果:3.79 cm 标准差的应用:描述变异程度、计算标准误、计算变异 系数、描述正态分布、估计正常值范围 标准差的意义:全面反映了一组观察值的变异程度。 越大说明围绕均数越离散,反之说明较集中在均数周围,均数代表性越好。 3.变异系数 意义:标准差与均数之比用百分数表示。 符号: CV 计算: CV=(S/X)?100% 无单位 应用:单位不同的多组数据比较,例如:身高、体重; 均数相差悬殊的多组资料,例如身高、头围。 四、正态分布 什么是分布? 1、图形 2、特征 3、面积 2、正态分布的特征 均数处最高; 均数为中心对称; 2个参数 N(μ ,?):决定图形的形状和位置 曲线下的面积有一定规律。 标准正态分布-正态分布的特殊形式 标准正态分布N(0 ,1); 标准正态变换(变换公式); 请计算:一次统计测验的平均分是72,标准差是15,求72分、 58分、93分的标准分数。 3、曲线下面积 横轴上曲线下的面积为1 曲线下,横轴上对称于z的面积相等,从-?到z; 1个标准差位置的面积,95%面积下的标准差, 99%面积下的标准差 95%,99%的面积公式: z 与所对应的面积P成反比。 双侧: 根据指标的实际用途,有的指标有上下界值,过高过低均属异常; 单侧某些指标过高为异常,只需确定上限;某些指标过低为异常,只需确定下限。 估计的方法: 1、正态分布法 2、百分位数法 2.百分位数法 应用条件 : 偏态分布资料 计算公式: 双侧界值:P 2.5 ~ P 97.5 单侧 上界: P 95 单侧 下界: P 5 第24页例题 1.各观察值加同“1”后: A.均数不变,标准差改变 B.均数改变,标准差

文档评论(0)

zijingling + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档