研究生统计学讲义第2讲第3章定量资料的统计描述.pptx

研究生统计学讲义第2讲第3章定量资料的统计描述.pptx

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章定量资料的统计描述;1.正态随机变量的概率密度函数的形式为;这个正态密度函数f (x) 关于平均值x=μ对称(点划垂线);第四页,共四十三页。;幸运的是,这个曲线族能够转换为标准正态曲线( standard normal curve),其平均值为0,标准差为1.曲线下的面积已经被制成表格,通常称为u表(u tables), u表能用来确定任何正态分布的CDF值.(累积分布函数值即P224附表3) 2.标准正态分布的概率密度函数和分布函数 (–∞< x <∞) (3.3) 标准正态变量u与一般均数为μ,标准差为σ的正态变量x的关系是: 标准正态变量u= (x-μ)/σ的值称为标准正态(离)差。;标准正态变量的分布函数记为Ф(u):;补例1 设智商测验得分是具有均数100,标准差为10的正态分布.(一些新颖的智商测验声称具有这些参数).问:;现在我们把X 转换为标准正态变量,因为μ=100,σ=10,所以;2.得分在90到115分之间的概率是多少?解:我们希望找出下图左图阴影部分的面积;解:要求P (X≥125),见下图.;补例2 假设女高血压患者舒张压大约集中在100mmHg,标准差是16mmHg ,血压是正态分布.求:;解3:求P (96<X<104),两者同时进行转换;这意味着这些女高血压患者舒张压低于126.32mmHg大约有 95%.;由正态分布的对称性可知,标准正态曲线下对称于0的区间面积相等: Ф(uα)=1-Ф(-uα),Ф(uα/2)=1-Ф(-uα/2), 第十四页,共四十三页。;例3.2 若已知健康女大学生血清总蛋白含量服从正态分布;u值在-0.46~1.23范围内的面积为Ф(1.23)-Ф(-0.46)=0 -0.3228=0.5679,即血清蛋白含量在72.0g/L~78.6g/L范围内概率为56.79%。 168名健康女大学生血清总蛋白含量在72.0~78.6g/L范围的人数为168×56.79%=95人 正态分布的应用 很多抽样分布如 2 分布、t 分布以正态分布为基础。 正态分布的规律运用于区间估计和假设检验如 t 检验、方差分析及直线相关分析的计算公式等。 二项分布、Poisson分布、t 分布的极限分布是正态分布。 许多医药指标如人体的某些正常生理值都可看作和近似看作服从正态分布。医药科研中很多资料如毒物致死量、食物中毒潜伏期,剂量一效应曲线、正常成人血铅含 量等,虽不服从正态分布,但经变量变换(???取对数)后则服从正态分布或近似正态分布,可按正态分布规律来处理;4.统计推断和计算公式的推导中经常应用到的正态变量性质;二、频数分布表和频数分布图(P29);用途:1.揭示资料的分布特征和分布类型。 便于进一步计算统计指标和分析处理。 便于发现某些特大或特小的特异值。 图像:对称、左偏、右偏 。特征:集中、离散 三、集中趋势的描述(P30) 1、均数;总体平均数:例如一个小的理论总体,其全体取值为:1;公式1.2 作为样本平均数的代数缩写式就是:;要使每一个样本均数是μ的无偏估计.取决于样本所含的值以及样本容量的实际大小.我们期望全部可能平均值的平均值与总体参数μ相等.事实上,这个定义就是总体均数的一个无偏估计.;例3.4 10例由伤寒杆菌引起伤寒的患者潜伏期为6,8 ,11,12,14,15,16,21,29,34天,求中位数。因n=10,为偶数,居中的两个位次为10 / 2 = 5,1+10;2. 在假设检验中用作拒绝或接受检验假设的临界值。;考虑例3.6,平均数为=16.6,而中位数=14.5cm .假如说X7被错误地记为160而不是16的话,平均数会变成 30cm,而中位数仍然保持=14.5cm .;极差(range);方差(variance);回到例,样本1的方差是0.641kg2,样本2 的方差是49.851 kg2,这反映出在样本2里有较大的分散(spread)度.;公式利用样本平方和的计算公式计算样本方差的公式是;再考虑金枪鱼的例,样本1: s1=0.80kg ,样本2: s2=7.06kg;1).双侧(1-α)容许区间 按标准正态变量值的分布规律P (-;2.医学参考值范围;因血清总蛋白含量不宜过高或过低,本例宜用双侧公式: ±1.96s=73.708±1.96×3.8759=(66.1,81.3)g/L 表3-5 常用uα界值表;第七节 离群值的取舍;1. 计量资料判断离群值;⑵. 格鲁布斯法 格拉布斯法(Grubbs)适用于正态分布资料。xj 表示极端值;Q 检验法不要求资料服从正态分布。数据从小到大排列;① 若已知M物质的含量服从正态分布,计算得到X=42.16μg, S=2.150μg;;查表3-6,μ和σ未知时T0.05,50=2.96,T0.05,60=3.0

文档评论(0)

158****0159 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档