Web用户行为模式挖掘及其在ELearning系统中应用.docVIP

Web用户行为模式挖掘及其在ELearning系统中应用.doc

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Web用户行为模式挖掘及其在ELearning系统中应用

Web用户行为模式挖掘及其在ELearning系统中应用      作者简介作者简介:张力平(1988-),女,青海师范大学计算机学院硕士研究生,研究方向为数据挖掘与生物信息。0引言   Web技术的飞速发展和Web信息的迅猛增长使得Web不再仅仅是一个信息共享和发布平台。如何在用户的Web活动中挖掘获取有价值的信息和隐含知识,并以此提供智能化、语义化、个性化的信息服务已经成为研究热点。   随着信息化教育的发展,数字化校园和网络教育逐渐成为人们足不出户完成教育和学习的关键领域,各种类型的教育软件和网站层出不穷,用户在自由浏览教育网站信息的同时出现了海量的具有潜在价值的日志信息。如何把这些教育数据转变成教育决策和教育教学活动优化等有用信息和知识,便是E??Learning用户行为模式挖掘的意义所在。   1Web数据挖掘   1.1Web数据挖掘及Web用户行为模式挖掘   Web数据挖掘(Web Data Mining)是数据挖掘技术在Web上的应用。Web挖掘是集数据挖掘、信息检索和信息抽取多种技术于一体的研究领域。Web数据挖掘的发展源于数据挖掘,但是Web挖掘的研究对象囊括了很多传统数据挖掘技术很难处理的数据:图像、视频、声音及网页之间的各种链接等。这些数据具有海量、异构、非结构化等特性,Web挖掘就是针对这些数据特点而进行研究并获取潜在有用信息的过程。   行为模式是指用户操作过程中所体现出来的某种规律性[1]。用户行为模式挖掘是在Web日志挖掘(Web usage mining)基础上的应用研究,以网络日志为研究对象。Web日志挖掘是指从用户的访问记录中提取感兴趣内容的挖掘模式。在用户浏览Internet信息的过程中,服务器会记录用户访问及其与客户端之间的交互信息(包括访问的页面、时间、用户ID等信息)并被记录在日志文件中,包括3种类型的日志文件:Server logs、Error logs、Cookie logs。Web用户行为模式挖掘正是对这3种日志文件进行挖掘,从而发现相似用户群体、访问模式、频繁路径等知识。   1.2Web行为模式挖掘   目前, Web行为模式挖掘研究领域主要包括:形式化描述网络访问行为、自动获取行为特征以及发现行为规律,研究的数据主要包括URL页面请求、页面间链接的拓扑结构、注册用户特征等[2]。常用的研究方法主要有统计分析、关联规则分析、聚类分析和频繁序列模式分析[3]。   (1)统计分析是指获取用户行为的统计信息,如访问时间、频率等[4]。   (2)关联规则分析可获取用户页面访问行为间的关系。   (3)聚类分析是指通过聚类将特征相似用户的访问行为特点归并分组。   (4)频繁序列模式分析可以获取用户访问习惯、爱好及趋势等[5]。   通过这些分析方法获得的数据在页面导航、应用和产品推荐及公共教育服务系统的开发方面有着十分重要的作用。   1.3用户行为模式挖掘工作流程   结合Web应用的需求,针对用户行为模式的特点,参照Web日志挖掘的方法和流程,建立了用户行为模式挖掘模型,其工作流程如图1所示。   图1Web用户行为挖掘工作流程   1.3.1数据准备   Web挖掘过程中的数据采集和预处理阶段,旨在收集Web服务器的访问日志文件,生成挖掘数据源,主要包括数据清洗、用户唯一性识别和完善访问路径等。通过这些可以有效地过滤掉一些类似用户访问传输协议、错误请求和短时间内多次重复的干扰信息,从而提高数据的纯净度、准确度和可信度。   1.3.2用户行为建模   早期的Web应用大多以静态网页的形式呈现,现在越来越多的应用系统转变为基于平台的,并逐步发展成为具有实时交互性和开放性的Web服务模式。人们发现在应用这些服务系统的过程中,理解用户与系统交互行为对于网络系统性能的提高、站点的重构以及个性化、多元化服务等具有重要意义[6]。同时,大量实践也表明,用户行为在时序、聚集、依赖等方面确实存在强一致性的行为特征[7]。   传统的建模方法和仅基于Web日志的访问路径建模方法缺乏对用户行为模式的动态语义信息描述,为了解决这些建模方式存在的问题,我们采用一种新的基于网页元数据的建模方式。根据Web用户行为的分层特性,行为模式可分为URL访问、活动、会话3个层次。   基于分层的行为模型在用户访问序列信息的基础上增加了访问内容的局部主题、关键字等信息,这样的行为模型不仅有助于对用户行为的分析和理解,而且为新的网络服务系统构建提供了良好的支持。   1.3.3用户频繁行为序列模式挖掘   用户行为序列模式挖掘是在用户行为序列模型的基础上,根据网络行为的一般规律,在目标用户群中通过序列模式挖掘方法,获得频繁的、普遍的、潜在的行为序列规律。

文档评论(0)

fangsheke66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档