基于集成学习的法院结案方式分类模型研究与实现.pdf

下载文档 降价啦

4
0
约6.97万字
约 77页
2020-12-22 发布于江苏
举报
版权申诉
保障服务

基于集成学习的法院结案方式分类模型研究与实现.pdf

1、本文档共77页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

摘要在现代科学技术快速发展的背景下，司法机关推进执行管理信息化与执行工作与现代技术深度融合，必然避不开云计算与人工智能。完善智慧法院顶层设计规划，推动法院执行工作向智能化、一体化、实用化方向发展，科学地利用现代技术手段破解传统执行难题，使现代技术理念贯穿执行工作，已经成为法院信息化建设的重中之重。本文的主要工作是研究利用大数据技术和人工智能中的集成学习算法来预测执行案件的结案方式，从而辅助解决执行难问题。案件结案方式自动预测的意义在于，一方面可以为申请人形成最佳的执行策略提供有力的司法保障；另一方面，可以帮助法官利用大数据和人工智能技术来保障司法的公平正义。此外，本文还引入了虚拟节点技术，该技术既可以解决传统执行平台的数据采集效率问题，也可以保证数据采集的安全性。利用云计算、大数据技术来推动法院执行工作信息化的做法是司法体制改革与现代科技结合的产物，此举大大提高了执行工作的质量、效率和准确度。本文第二章首先详细介绍了相关技术的理论和优缺点，接着设计了一套数据清洗和编码流程，其次使用关联规则算法挖掘与结案方式相关的规则，然后针对统计分析标准中指标权重的选择问题，本文采用了信息增益法来探究特征的重要度，并使用 SMOTE 算法解决数据不平衡问题。最后，通过在 VMware vSphere 云平台下搭建分布式 Hadoop 数据节点并使用 H2O 的框架分析相关算法的性能。本文第三章基于第二章已处理好的数据，使用集成 K 近邻算法、朴素贝叶斯算法、决策树算法和随机森林算法组成的 Stacking 方式来对结案方式分类进行研究，并与投票分类器方法进行比较，对比实验结果表明 Stacking 算法的分类效果更胜一筹。最后，本文第四章基于 VMware vSphere 虚拟节点设计数据采集方式，同时设计了两种安全认证方式来确保数据采集的安全性。关键词：执行工作；Hadoop ；集成学习；随机森林；虚拟节点 I 目录摘要I Abstract II 目录IV 第 1 章绪论 1 1.1 研究背景及意义 1 1.2 国内外研究现状 2 1.2.1 执行信息化国内外研究现状 2 1.2.2 集成学习算法国内外研究现状 3 1.2.3 虚拟节点技术国内外研究现状 8 1.3 研究内容与结构安排 11 第 2 章基于随机森林算法的结案方式分类模型研究 13 2.1 问题定义 13 2.2 数据预处理 14 2.2.1 对申请标的、结案标的数据进行清洗 15 2.2.2 对执行主体进行数据清洗 16 2.2.3 对所有的变量进行编码 17 2.2.4 使用关联规则算法挖掘结案方式的模式 19 2.2.5 使用信息增益权重法挖掘特征重要度 21 2.2.6 使用SMOTE算法处理样本不平衡数据集 22 2.3 随机森林算法理论 23 2.4 实验方案 25 2.5 本章小结 35 第 3 章基于 Stacking 集成学习的结案方式分类模型的研究 36 3.1 Stacking集成学习方法 36 IV 3.1.1 Stacking算法 36 3.1.2 K近邻算法 37 3.1.3 朴素贝叶斯算法 38 3.1.4 决策树算法 38 3.1.5 投票分类器算法 39 3.2 实验方案 41 3.3 本章小结 48 第 4 章基于 VMware vSp