- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
重庆大学硕士学位论文 中文摘要
摘 要
社交网络是由该网络的用户与用户通过一定的交流和互动而形成的一种复杂
的大型关系网络。随着移动互联技术和社交媒体软件技术的快速发展,对社交网
络中信息传播产生影响的因素也发生了很大变化,对社交网络的信息传播展开分
析与挖掘,在热点发现、产品营销、舆情管控等应用方面有重要的现实意义。微
博作为重要的社交网络平台,从发布至今,迅速以其内容简洁、交互方便、传播
迅速等特点,成为人们分享、获取和传播信息的重要载体。微博转发是微博平台
信息传播的重要机制,它使信息呈现爆炸式的扩散效果。因此,对用户的转发行
为进行预测显得尤为必要。
转发行为预测的挑战在于如何找到更多有价值的影响因素以提高预测性能。
本文对影响微博转发的用户特征进行了深入的分析,总结出了影响力特征、话题
特征、活跃度特征、兴趣特征四大类特征组成的用户扩展特征集合。分析结果显
示,微博被转发率、用户转发的活跃性、用户之间的交互强度等特征具有较强的
区分特性,而反观用户的粉丝数、关注数、PageRank 值等特征则区分特性不明显。
基于本文的用户特征集合,对朴素贝叶斯算法原理进行剖析,对分类器的构
造过程进行推导,为了弥补朴素贝叶斯算法本身具有条件独立性假设限制的不足,
本文采用了新的属性加权方法进行算法改进。同时,根据训练数据集划分的随机
性特点,提出了训练集中存在较优训练子集的初期假设。采用增量优化的方法,
获取具有更高预测性能的优化训练数据集。在爬取的真实社交网络新浪微博数据
集上开展系列实验,实验结果表明:(1)对比其它研究中的特征集合,使用本文
中的用户扩展特征集合,各分类预测算法的性能指标都有一定幅度的提升,验证
了特征分析提取方法的有效性;(2 )改进的属性加权朴素贝叶斯算法最高预测准
确率高达93%,与原有算法相比,预测准确率提高了8%,达到了实验的预期效果;
(3 )通过增量优化实验,找到了较优的样本训练集合,使用该集合能进一步提高
预测的性能和效果,验证了初期的假设。
关键词:社交网络;信息传播预测;用户特征分析;加权朴素贝叶斯;增量优化
I
重庆大学硕士学位论文 英文摘要
Abstract
Social network is a complex large-scale relationship network formed by users of
the network communicating and interacting with each other. With the tremendous
development of mobile internet technology and social media software technology, the
factors affecting the information dissemination of social networks have also undergone
great changes. The analysis and mining of information dissemination of social networks
has important practical significance in hot spot discovery, product marketing, public
opinion management and other applications. As an important social network platform,
micro-blog has become an important carrier for people to share, acquire and
disseminate information with its conte
您可能关注的文档
- 基于压缩感知的太赫兹时域光谱成像算法研究.pdf
- 基于岩土分层条件下渗流对竖直地埋管换热性能的影响.pdf
- 基于氧化石墨烯纳米流体的气-液直接接触式蓄冰系统.pdf
- 基于业务分级的大规模机器类通信接入机制研究.pdf
- 基于液态金属的柔性应变传感器性能优化模拟与实验研究.pdf
- 基于一维仿真软件对汽车空调部件及系统的优化与控制.pdf
- 基于移动终端传感器数据的汽车行驶油耗估计方法.pdf
- 基于遗传算法的仿生微流道热沉多目标优化及热-流协同特性研究.pdf
- 基于遗传算法的机械产品选配技术及其应用研究.pdf
- 基于蚁群算法的预制构件生产多目标优化研究.pdf
- 补充《角度的换算-角的计算》(课堂PPT).ppt
- 结构化理论课——徐球球.pdf
- 2024年公务员(国考)之行政职业能力测验真题汇编及参考答案(满分必刷).docx
- 2023年广西梧州市藤县直属机关服务中心招聘笔试《行政职业能力测验》模拟试卷(答案详解版).docx
- 2024年磐石市驿马镇乡镇机关选调生职位公务员招录1人《行政职业能力测验》模拟试卷(答案详解版).docx
- 2024年省新郑监狱执法勤务类四级警长及以下公务员招录1人《行政职业能力测验》模拟试卷(答案详解版).docx
- 吉林省长春市朝阳区事业单位公开招聘笔试《行政职业能力测验》模拟试卷(答案详解版).docx
- 2023年福建省龙岩市上杭县招聘“三支一扶”笔试《行政职业能力测验》模拟试卷(答案详解版).docx
- 2024年老河口市发展和改革局综合管理岗招录2人《行政职业能力测验》模拟试卷(答案详解版).docx
- 山东省廊坊市广阳区事业单位公开招聘笔试《行政职业能力测验》模拟试卷(答案详解版).docx
文档评论(0)