独立性检验的基本思想及其初步应用经典题型课件.ppt

独立性检验的基本思想及其初步应用经典题型课件.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
P(K2≥k0) 0.10 0.05 0.010 0.001 k0 2.706 3.841 6.635 10.828 【解题指南】分层抽样,等比例取人,读出直方图的信息,列出基本事件,根据古典概型,求出相应概率,按K2公式计算.根据表格读出把握性. 【解析】(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名,所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3.25周岁以下组工人有40×0.05=2(人),记为B1,B2. 3.2  独立性检验的基本思想   及其初步应用 人们都认可“吸烟具有危害性”,那么,人们 认可这个观点,有什么根据么?吸烟是否对肺癌 有影响呢?下面我们用数学知识来分析一下, 这个观点是否具有科学根据…… 1.理解独立性检验的基本思想.(重点) 2.会从列联表、等高条形图直观判断吸烟与患肺癌 有关.(难点) 3.了解随机变量K2的含义,理解独立性检验的基本思想及实施步骤.(难点) 探究点1 独立性检验的基本思想 对于性别变量,其取值为男和女两种.这种变量 的不同“值”表示个体所属的不同类别,像这样的变 量称为 . 分类变量在现实生活中是大量存在的,如是否吸烟,是否患肺癌,宗教信仰,国别,年龄,出生月份等. 分类变量 不患肺癌 患肺癌 总计 不吸烟 7 775 42 7 817 吸烟 2 099 49 2 148 总计 9 874 91 9 965 问题:为了研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9 965人,得到如下结果: 吸烟与患肺癌列联表(单位:人) 在吸烟者中患肺癌的比重是_______. 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大. 2.28% 在不吸烟者中患肺癌的比重是_______, 0.54% 通过图形直观判断两个分类变量是否相关: 等高条形图 通过数据和图形分析,得到结论是:吸烟与患肺癌有关.那么这种判断是否可靠呢?我们可以通过统计分析回答这个问题. 假设H0:吸烟与患肺癌之间没有关系, 吸烟与患肺癌列联表(单位:人) 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 如果“吸烟与患肺癌没有关系”,那么吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比例差不多. 即 引入一个随机变量 它是检验在多大程度上可以认为“两个变量 有关系”的标准. ︱ad-bc︱越小,说明吸烟与患肺癌之间的关系越弱; ︱ad-bc︱越大,说明吸烟与患肺癌之间的关系越强. 其中n=a+b+c+d为样本容量. 不患肺癌 患肺癌 总计 不吸烟 7 775 42 7 817 吸烟 2 099 49 2 148 总计 9 874 91 9 965 通过公式计算 吸烟与患肺癌列联表(单位:人) 已知在 成立的情况下, 即在 成立的情况下,K2的观测值大于6.635 的概率非常小,近似为0.01,是一个小概率事件. 思考:这个值到底告诉我们什么呢? 现在K2的观测值k≈56.632,远远大于6.635,所以有理 由断定H0不成立,即认为“吸烟与患肺癌有关系”. 独立性检验的定义   利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验. 独立性检验的一般步骤 (1)假设两个分类变量X与Y没有关系. (2)计算出K2的观测值k. (3)把k的值与临界值比较确定X与Y有关的程度或 无关系. 设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为   y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 如P(k>10.828)= 0.001表示在犯错误的概率不超过0.001的前提下,认为“X与Y有关系”. 如P(k>6.635)= 0.010表示在犯错误的概率不超过0.010的前提下,认为“X与Y有关系”. 临界值表: 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 独立性检验的基本思想类似反证法 (1)假设结论不成立,即“两个分类变量没有关系”. (2)在此假设下随机变量K2应该很小,如果由观测数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理. (3)根据随机变量K2的含义,

文档评论(0)

随风飘落 + 关注
实名认证
内容提供者

人力资源管理师持证人

一个写作爱好者,与大家分享

认证主体赵**
领域认证该用户于2023年07月07日上传了人力资源管理师

1亿VIP精品文档

相关文档

相关课程推荐