用SPSS19进行主成分分析教学PPT课件.pptVIP

用SPSS19进行主成分分析教学PPT课件.ppt

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
手把手教你用SPSS19进行主成分分析 主成分分析(PCA) 核心思想:降维。在损失很少信息的前提下(肯定会损失一些信息,因为毕竟最后你只是提取了前几个主成分),把多个原始指标(一般大于5个才有意义)转化为几个综合指标(即主成分)的分析方法。 原始指标越相关,降维的效果就越好 各个主成分之间互不相关。 信息贡献影响力综合评价 与因子分析的区别 因子分析是从主成分分析方法发展、延伸出来的一种新方法。因此在进行因子分析时,提取公因子的方法,除了主成分分析法之外,还有不加权最小二乘法、普通最小二乘法等等。 1)因子分析需要构造因子模型,着重要求新变量具有实际的意义,能解释原始变量间的内在结构。 (2)主成分分析仅仅是变量变换,是原始变量的线性组合表示新的综合变量(主成分),强调主成分贡献了多大比例的方差,并不关心主成分是否有明确实际意义。 数据准备工作 注意:有一类数据叫做状态特性数据,如植株直立或伏地、叶色和茎色等,这类数据要进行转化,根据表型赋值,将其改变为数量特性数值才能参与计算分析。比如下面的 补充知识点:数据为什么要标准化? 标准化后的数值就都转化为平均值是0,方差是1的无量纲数据。 做数据标准化是为了消除量纲(简单说就是单位)和数量级的影响。比如我有XXX植物种质资源的形态性状16个指标,它们的量纲就不同,株高是“cm”,主茎数是“个”,各个指标的属性不同,就无法直接进行比较和综合,同时,有些数值较大的指标,在综合评价时所占的绝对比例就更大,绝对作用就更突出,数值较小的可能就没几乎影响。 数据标准化在SPSS软件因子分析(F)过程中会自动进行。如果需要看标准化后的数值,则需要我们自己在SPSS里操作,后面会详细说明。 第一步,打开SPSS软件,导入数据,点击“打开” 第二步,选择“因子分析(F)”(SPSS软件是将主成分分析整合在“因子分析(F)”里,没有单独列出) 把自己要分析的指标都选入“变量”中,进入“描述”,勾选“系数”选项 其他选项都默认,最后点击“确定” 得到结果,可以将结果导出,然后慢慢分析每个表 导出结果 第一个表:这个其实就跟我们做pearson相关性分析的结果一样。主要是看看原始指标之间的相关性如何。 第二个表:方差分解主成分提取分析表 主成分个数提取了6个,这个提取的原则是主成分特征值大于1(如果特征值小于1,说明该主成分的解释力度还不如直接引入原始指标的平均解释力度大) 前6个主成分解释了19个原始指标信息的76.263%,效果算比较好(当然是越接近100%效果越好),也印证了前面说的主成分分析会损失掉一些信息。 补充知识点:主成分的个数选多少个比较合适? 有3个主要的参考衡量标准,具体还是要根据自己实验的具体要求进行取舍: 保留的主成分使得方差贡献率达到80%以上 保留的主成分的方差(特征值)大于1 Cattell碎石检验绘制了关于各主成分及其特征值的图形,我们只需要保留图形中变化最大之处以上的主成分即可 第三个表:初始因子载荷矩阵 表中数值显示的是每个主成分与原始指标之间的相关系数。 因此,绝对值越大,越相关。例如,主成分1主要反映的是株高、地茎、株幅、叶长、叶宽、叶色、生育期、根粗(芦头处)和根重。 自己在excel里操作:计算各个主成分中各原始指标的系数,建立主成分方程 以主成分1为例:各指标的系数=相关系数/SQR(特征值) 因此,主成分得分F1=0.363X1+0.304X2+0.340X3-0.01X4+0.089X5+0.101X6+0.166X7+0.285X8+0.280X9-0.100X10-0.300X11+0.176X12-0.274X13+0.003X14+0.108X15+0.293X16+0.127X17+0.319X18+0.180X19 注意:在计算F1值时,X1、X2、X3······都是标准化后的数据值,不是用的原始数据! 标准化后的数值需要我们自己在SPSS里点一下

您可能关注的文档

文档评论(0)

liuxing044 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档