基于决策树算法的数据挖掘技术研究论文.doc

基于决策树算法的数据挖掘技术研究论文.doc

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于决策树C4.5算法的数据挖掘技术研究 摘 要: 在过去的数十年中,我们产生和收集数据的能力已经迅速提高,存贮数据的爆炸性增长已激发对新技术和自动工具的需求,以便帮助我们将海量数据转换成信息和知识。以下介绍了数据挖掘技术的发展概况,及相关数据挖掘技术分类器,及同时利用9个学习样本数据做为基础,并采用数据挖掘中的决策树算法C4.5技术就如何实现生成一棵树的相关知识进行了研究,特别说明了生成一个树的基础分析,给出了实际应用例子。结果表明,由决策树算法C4.5技术能够很好的实现数据挖掘功能。 关 键 词: 数据挖掘,知识发现,决策树算法,分类器,C4.5算法,生成树。 Research on the technical research according to the decision tree calculate way C4.5 data 【Abstract】: In past few decades, we produce to has already raised quickly with the ability of the collections data, the explosion growth that save the data of 贮 has already stired up the need to newly the technique and automatic tool, in order to help we become the amount of sea data conversion information and knowledge.Introduced the data to scoop out the technical development general situation as follows, and the related data scoop out the technique classification machine, and make use of 9 studies sample data to be used as the foundation at the same time, and the adoption data scoop out the medium decision tree calculate way C4.5 technique how carried out the related knowledge of a tree to carry on the research, specially explained the foundation of born tree analysis, give actual applied example.As a result express that be can be good by the decision tree calculate way C4.5 technique to carry ut the data excavation function.result express that be can be good by the decision treecalculate way C4.5 technique to carry out the data excavation function. 【Keyword】: The data scoop out, knowledge detection, the decision tree calculate way, the classification machine, calculate way of C4.5 principle nodes)”来描述物理、生物和社会系统的基础上。这种方法从基础的科学模型入手,如牛顿运动定律或麦克斯韦的电磁公式,然后基于模型来建立机械工程或电子工程方面的各种运用,用实验数据来验证基本的“首要原则模型”,以及对一些难以直接测量或者根本不可能直接测量的参数进行评估。但是在许多领域,基本的“首要原则模型”往往是未知的,或者研究的系统太复杂而难以进行数学定型,随着计算机的广泛应用,像这样的复杂系统产生了大量的数据,对大型的、复杂的、信息丰富的数据集的理解实际上是所有的商业,科学工程领域的共同需要,吸取隐藏在这些数据后面的有用知识变的越来越重要。运用基于计算机的方法,包括新技术,从而在数据中获得有用知识的整个过程,就称为数据挖掘。它是一个反复迭达的过程,在这个过程中,所取得的进步用“发现”来定义,但这种发现是通过自动或手工方法取得的,在对什么将构成一个“有趣的”结果没有预定概

文档评论(0)

山丹丹 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档