第2讲 计量资料的基本统计分析方法.ppt

第2讲 计量资料的基本统计分析方法.ppt

  1. 1、本文档共78页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第2讲 计量资料的基本统计分析方法

2006.08 第二讲 计量资料的基本统计分析方法 1.计量资料(或定量变量) measurment data ,quantitative data, 2.计数资料(或定性变量,无序分 类变量) enumeration data, qualitative data, unordered category data 3.等级资料(或半定量资料,有序分类变量) ranked data,semi-quantitative data, ordinal category data 计量资料的统计描述 平均数指标 平均数(average) 是描述一群同质变量值集中位置的特征值,用以说明同类现象或事物数量的中等水平(集中趋势)。 1. 定义:简称均数,符号为 (相应的总体均数记为μ)。定义公式为 算术均数适合于对称分布的资料,如分布均匀的小样本数据或近似正态分布的大样本数据; 算术均数容易受极端值的影响。 将一组变量值按大小顺序排列,位次居中的变量值即为中位数。中位数将变量值一分为二,一半比它小,一半比它大。符号为M、Md。 2. 中位数的应用与特点 中位数将频数等分为二,所以中位数适合各种类型的资料,尤其适合于大样本偏态分布的资料。 由于中位数总处在居中的位置上,因而它不受特大或特小值的影响。 变异指标 变异指标——又称离散指标,用以描述一组计量资料各观察值之间参差不齐的程度。 三组同性别、同年龄儿童体重 一.四分位数间距 四分位数间距(Q)包括了全部变量值中居于中间水平的一半数据的分布范围。 Q = P75 – P25 二.方差与标准差 方差(Variance)分为样本方差和总体方差。样本方差符号为 ,相应的总体方差符号为 。 三组同性别、同年龄儿童体重 方差或标准差属同类变异指标,它们多用来描述均匀分布或近似正态分布的资料,大、小样本均可,其中以标准差的应用最广,通常与均数结合使用。比如在许多医学研究报告中常用 的形式表达资料。 三.变异系数 计量资料的统计推断 依据随机样本对未知事物进行判断和决策 --假设检验 P值和α的关系 P和α本质相同,都为概率,P是根据当前试验计算的概率,α是预先给定的概率,为检验水准,是定义了的小概率上限。因此计算得到的P值要与α进行比较才能给出假设检验的结论。 假设检验的注意事项 一是需要从全局的范围,即从总体上对问题作出判断,单纯比较样本会有风险; 二是不可能或不允许对研究总体的每一个个体均作观察。 Why 假设检验(hypothesis testing)亦称显著性检验(significance testing):它是利用小概率反证法思想,目的是通过考察一部分样本对总体作出二择一的决策。 What 实例 通过以往大规模调查,已知某地一般新生儿的头围均数为34.50cm,标准差为1.99cm。为研究某矿区新生儿的发育状况,现从该地某矿区随机抽取新生儿55人,测得其头围均数为33.89cm,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同? 假设检验的目的——就是判断差别是由哪种原因造成的。 ①?抽样误差造成的 ②?本质差异造成的 How 根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等(如数据的分布类型)选用适当的统计方法,选择并计算相应的统计量(如t, u, ,F值)。 Where P值概念 P值概念——错误拒绝H0的概率。即在H0所规定的总体中作随机抽样,得到绝对值等于或大于上一步计算出的检验统计量的概率。 若P<α,结论为按所取α检验水准拒绝H0,接受H1,差别有统计学意义; 其统计学依据是,在H0成立的情况下,得到现有统计量的概率P<α,是小概率事件,因为小概率事件不可能在一次抽样中发生,所以拒绝H0。 若P>α,结论为按所取检验水准不拒绝H0,差别没有统计学意义。 不拒绝H0,但不能下“无差别”或“相等”的结论,只能下“根据目前试验结果,尚不能认为有差别”的结论。 P值的意义:如果总体状况和H0一致,统计量获得的现有数值以及更不利于H0的数值的可能性(概率)有多大? α值的意义:错误地拒绝H0 的概率或接受H1 的风险。一般α=0.05或0.01 (1)可比性 (2)正确选用假设检验方法 (3)判断结论时不能绝对化,提倡使用精确P值。 (4)单侧检验与双侧检验 (5)可信区间与假设检验各自不同的作用,要结合使用。95%CI既能说明差别的大小,也具有检验的作用,建议使用

文档评论(0)

sandaolingcrh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

认证主体陈**

1亿VIP精品文档

相关文档

相关课程推荐