“多变量分析”——数据挖掘、数据分析.pdf

“多变量分析”——数据挖掘、数据分析.pdf

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
“多变量分析”——数据挖掘、数据分析 I。多重对应分析 多重对应分析在超过两个以上定类变量时有时候⾮常有效,当然⾸先我们要理解并思考,如果只有三个或有限的⼏个变量完全可以通过数据变换和交互表变量重 组可以转换成两个定类变量,这时候就可以⽤简单对应分析了。 对应分析对数据的格式要求: 对应分析数据的典型格式是列联表或交叉频数表。 常表⽰不同背景的消费者对若⼲产品或产品的属性的选择频率。 背景变量或属性变量可以并列使⽤或单独使⽤。 两个变量间——简单对应分析。 多个变量间——多元对应分析。 现在,我们还是来看看如何操作多重对应分析并如何解读对应图; 我们假定有个汽车数据集,包括:来源国(1-美国、2-欧洲、3- ⽇本),尺⼨(1-⼤型、2-中型、3-⼩型),类型 (1-家庭、2-运动、3-⼯ 作),拥有(1-⾃有、2-租赁)性别(1-男、2-⼥),收⼊来源(1-1份⼯资来源、2-2份⼯资来源),婚姻状况(1-已婚、2-已婚有孩⼦、3- 单⾝、4-单⾝有孩⼦); 从数据集看,我们有7个定类变量,如果组合成简单的交叉表是困难的事情,此时采⽤多重对应分析是恰当的分析⽅法。 下⾯我还是采⽤SPSS18.0,现在叫PASW Statistics 18.0来操作!注意:不同版本在多重对应分析⽅法有⼀些不同,但⼤家基本上可以看出 了,⾼版本只能是更好,但选择会复杂和不同! 在进⾏多重对应分析之前,研究者应该能够记住各个变量⼤致有多少类别,个别变量如果变量取值太偏或异常值出现,都会影响对应分析的 结果和对应图分析! 在SPSS分析菜单下选择降维(Data Redaction-数据消减)后选择最优尺度算法,该选项下,根据数据集和数据测量尺度不同有三种不同的 ⾼级定类分析算法,主要包括:多重对应分析、分类(⾮线性)主成分分析、⾮线性典型相关分析; 注意:随着版本的增⾼,研究⼈员在统计分析时就要各位主要变量的测量尺度,并且最好在进⾏数据清理和分析前,明确定义好测量尺度; 当然也要做好Lable⼯作! 接下来,我们就可以选择变量和条件了! ⼤家可以把要分析的变量都放到分析变量内,补充变量的含义是如果有哪个变量你并不想作为对应分析的变量,⽽只是作为附属变量表现在 对应图上可以加⼊!这⼀点其实在简单对应分析也有这种定义。(我们将在专门的简单对应分析⽅法中再讲!) 然后我们要选择“变量”选项,⼤家可以选择类别图:每⼀个变量的分类图,重点是选择联合类别图,我们把7个变量全部放⼊,执⾏!(其它 选项⼤家可以测试,我还有⼀些没有搞清楚) 下⾯我们看结果: 从图中我们可以看出:美国车都⽐较⼤,家庭型,主要购买者是已婚带孩⼦的;⽇本和欧洲车主要是⼩型、运动的和已婚没有孩⼦的⼈购 买;特别注意:单⾝和单⾝带孩⼦的往往是租赁汽车,收⼊单⼀来源,但这个地区没有车满⾜这个市场,或许是市场空⽩; 具体的解读⼤家可以根据⾃⼰的研究设计和假设去寻找答案! 主要统计指标可以看: 上图主要给我们了对应图维度的解释⽐率,最下⾯的图⼤家会看吗? 提⽰:夹⾓是锐⾓意味着相关,所以:定类变量的相关性是不是可以解释啦! 总结:(同样适合简单对应分析) 对应分析的优点: 定性变量划分的类别越多,这种⽅法的优势越明显。 揭⽰⾏变量类别间与列变量类别间的联系。 将类别联系直观地表现在⼆维图形中(对应图)。 可以将名义变量或次序变量转变为间距变量。 对应分析的缺点: 不能⽤于相关关系的假设检验。 维度要由研究者决定。 有时候对应图解释⽐较困难。 对极端值⽐较敏感。 II.对应分析是⼀种多元统计分析技术,主要分析定性数据Category Data⽅法,也是强有⼒的数据图⽰化技术,当然也是强有⼒的市场研究分析技术。 这⾥主要介绍⼤家了解对应分析的基本⽅法,如何帮助探索数据,分析列联表和卡⽅的独⽴性检验,如何解释对应图,当然⼤家也可以看到如何⽤SPSS操作对应分析和对数据格式的要 求! 对应分析是⼀种数据分析技术,它能够帮助我们研究由定性变量构成的交互汇总表来揭⽰变量间的联系。交互表的信息以图形的⽅式展⽰。主要适⽤于有多个类别的定类变量,可以揭 ⽰同⼀个变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。适⽤于两个或多个定类变量。 主要应⽤领域: 概念发展 (Concept Development) 新产品开发 (New Product Development) 市场细分 (Market Segmentation)

文档评论(0)

132****6651 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档