第三讲聚类分析.pptVIP

  1. 1、本文档共89页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * §3.4 系统聚类法 目录 上页 下页 返回 结束 3.4.3 离差平方和法(或称Ward方法) 离差平方和方法是由Ward提出来的,许多资料上称做Ward法。他的思想是来于方差分析,如果类分得正确,同类样品的离差平方和应当较小,类与类之间的离差平方和应当较大。 当前第63页\共有89页\编于星期三\9点 * * § 3.3 类和类的特征 目录 上页 下页 返回 结束 (1) 最短距离法。(nearest neighbor或single linkage method) 当前第31页\共有89页\编于星期三\9点 * * § 3.3 类和类的特征 目录 上页 下页 返回 结束 (2) 最长距离法(farthest neighbor或complete linkage method)。 当前第32页\共有89页\编于星期三\9点 * * § 3.3 类和类的特征 目录 上页 下页 返回 结束 (3) 类平均法(group average method)。 当前第33页\共有89页\编于星期三\9点 * * § 3.3 类和类的特征 目录 上页 下页 返回 结束 (4) 重心法(Centroid method)。 (5) 离差平方和法(Sum of Squares method)。 当前第34页\共有89页\编于星期三\9点 2,4 1,5 6,5 红绿(2,4,6,5)8.75 离差平方和增加8.75-2.5=6.25 黄绿(6,5,1,5)14.75 离差平方和增加14.75-8.5=6.25 黄红(2,4,1,5)10-10=0 当前第35页\共有89页\编于星期三\9点 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 系统聚类法(hierarchical clustering method)在聚类分析中诸方法中用的最多,包含下列步骤: 当前第36页\共有89页\编于星期三\9点 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 不同的距离定义方式用到系统聚类程序中,得到不同的系统聚类法。我们现在通过一个简单的最短例子,来说明各种系统聚类法。 当前第37页\共有89页\编于星期三\9点 当前第38页\共有89页\编于星期三\9点 图解上述聚类过程如下,此图清楚说明了分组与分组发生时的距离水平。 当前第39页\共有89页\编于星期三\9点 设抽取五个样品,每个样品只有一个变量,它们 是1,2,3.5,7,9。用最短距离法对5个样品进行分类。 首先采用绝对距离计算距离矩阵: ? 0 ? ? ? ? 1 0 ? ? ? 2.5 1.5 0 ? ? 6 5 3.5 0 ? 8 7 5.5 2 0 当前第40页\共有89页\编于星期三\9点 然后 和 被聚为新类 ,得 : ? 0 ? ? ? 1.5 0 ? ? 5 3.5 0 ? 7 5.5 2 0 当前第41页\共有89页\编于星期三\9点 0 3.5 0 5.5 2 0 当前第42页\共有89页\编于星期三\9点 0 3.5 0 当前第43页\共有89页\编于星期三\9点 各步聚类的结果: (1,2) (3) (4) (5) (1,2,3) (4) (5) (1,2,3) (4,5) (1,2,3,4,5) 当前第44页\共有89页\编于星期三\9点 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 【例3.4】 为了研究辽宁等5省份2000年城镇居民消费支出的分布规律,根据调查资料作类型划分。指标名称及原始数据见表3.5。资料来源[10] 当前第45页\共有89页\编于星期三\9点 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 当前第46页\共有89页\编于星期三\9点 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 3.4.1 最短距离法和最长距离法 所谓最短距离法就是类与类之间的距离采用(3.12)的系统聚类方法。 当前第47页\共有89页\编于星期三\9点 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 当前第48页\共有89页\编于星期三\9点 * * §3.4 系统聚类法 目录 上页 下页 返回 结束 当前第49页\共有89页\编于星期三\9点 * * §3.

文档评论(0)

hebinwei1990 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档